分类目录归档:Uncategorized

update.

或许熟悉我们的朋友已经知道,我们大概有两年没有在全景技术方面继续展开新的工作了。这里的主要原因是,我们跳进了另一个坑,算法交易,并且作为一个袖珍团队,很快就被吸干了精力。另一方面,像全景这样的技术,通过技术合作或者技术服务来盈利并非易事,你很难确保知识产权不被侵犯(企业跟你边“合作”边“学习”,事了另起炉灶留你干瞪眼儿这种事儿清华计算机系的老师们都没少遇到),另外整个产品化周期过长,自身团队之外的种种不可控因素过多,都成为要考虑的问题。最初选择这种形式来运营只有一个原因,就是自由和独立。保持团队有限精力不被过多侵蚀,保持做“闲事儿”的权利。如今跳了另一个坑,也无非是这样一个动机。

由于两年间精力都在构筑我们的算法交易平台,我并没有太多时间来考虑全景技术的未来。直到后来看到海思推出了芯片解决方案,我心里一沉,感觉14年时就曾经在担心的事情,终于还是来了。去年我开始考虑将一部分未曾做落地应用,单纯玩儿出来的算法做开源,但并没有足够多时间来整理这些工作,迄今仍未实现。

我们经常嘲笑自己,埋头在家做了好多东西,很多都是工业级强度的东西,都扔在硬盘里睡大觉,就又跑去搞别的新奇玩意儿。这是一个纯技术团队的很大缺陷,而我们直到今天也没(lan)有(de)克服。

所以今天对于我们全景技术的未来做一些说明。

首先,之前的合作我们一直在持续,产品也一直都稳定量产着,有兴趣的客户可以联系深圳华途数字了解产品具体情况。这些高清晰度安防全景产品应用了我们的量产标定技术以及实时拼接融合技术,由我们提供二次开发SDK,算法质量顶级(量产三年来大概只fix了1次较严重bug[在某些型号的机器上,某个全景投影类型和别的类型混淆,已经完全通过软件升级解决],加上我不记得的小bug,总量应该小于5个),您可以信赖。

然后,我们会尽可能花空闲时间整理过去的未公开技术并完成开源。至于工业级代码是否开源,取决于今后的具体情况。

最后,目前已经产品化的量产标定技术、实时拼接融合技术,如果您是安防或VR业内top5的靠谱公司,欢迎来聊聊技术收购(客官我们只卖术不卖身吆)。如果您是海思这样的高富帅芯片厂商,请直接来谈朋友(求你了)!如果你们都不来,我就择吉日都开源掉,我们这样的geek还是适合做开源。

至于这个网站,以后会自我放飞成为一个geek的后花园。

全景视频相关需求征集

首先说一下我们目前的情况。到今天,我们的全景技术已经非常完善的产品化,性能、质量和稳定性都趋于收敛,可以不夸张的说,这一技术目前处于世界上领先的地位。

我们有目前最高的实时拼接融合性能,在普通笔记本上可以做到数千万像素的实时拼接。在这一实时拼接模块的驱动下,实现超高清全景直播只需要一台普通中端笔记本。基于这一模块,我们在安防领域实现了4000w像素实时全景监控,且在笔记本上,子码流模式下可以同时进行多达30个全景实时浏览。该模块其余特征包括:

  1. 子/主码流动态切换机制。小窗口时用子码流,放大观看用主码流,后台实时切换,非常适合安防监控领域。
  2. 多种全景类型。包括但不限于交互式球面/半球/柱面,球面180/360展开,柱面180/360展开,小世界,双目上下/左右格式的3D全景等等。
  3. 可以将全景图实时播放,也可以实时回传给图像分析算法。
  4. 可以将全景像素坐标、输入视频像素坐标、物理空间实际方向互相转换。在安防领域可以以此实现全景/球机联动,全景/全景联动实现局域放大等;也可以籍此实现一些增强现实效果。

我们有一套强大的量产标定算法,支持对任意多路,任意多不同类型的摄像机进行最优拼接参数标定,支持无显著重合区情况下的标定,拼缝达到理论极小值,固定步骤可以得到稳定标定结果,返工率极低

以上全部技术完全自主知识产权。不依赖于PTGUI/OpenCV等第三方实现。也正因为如此,我们对技术中全部细节都具有掌控力,不会因为一个问题出在第三方代码中而束手无策。

******************************************************************

然后说一下此文的真正目的,即收集各行业对于全景视频的需求

VR这个风口吹起来了漫天的塑料袋,但没有看到太多扎实漂亮的产品。我们希望做一款这样的产品。所以我们希望收集您对于全景视频最迫切的渴求,以此决定接下来的方向。您只需简略说明在您这里全景的用途,以及对它的一些特殊要求即可,可以在本站留言,也可发邮件:

planckscale1729@163.com

QQ是397692433, 但不太经常上,可能没法及时相应您:-P

升维成功,有3D全景了

最近出门,在深圳的旅馆里埋头干了两天,算法终于可以支持3D全景了,昨晚十一点多用CardBoard看到自己第一个3D全景视频,很幸福。

得益于初期花费大量精力建立起来的良好架构,加入3D全景的过程还算轻松,另外由于近景标定技术的支持,我们可以对大半径的3D全景相机做高精度标定,达到理论最优效果。早期投入的时间和精力还算没有白费。

3D全景技术目前大致有两类,一类基于传统的拼接,双目各自拼一个全景球;一类基于双目的三维重建。我们目前是第一类技术。

第一类技术门槛较低,是目前市面上能见到的主要方式。这类技术的缺陷主要是拼缝难以克服,另外理论上无法实现真正的3D全景,在抬头低头时没有深度感。具体的体验能达到怎么样的程度,也是我们接下来要重点测试的。

采用第二类技术的典型是google jump, 目前据说jump仍然要消耗巨量的计算力来完成这种重建,直播更是不可能。它的好处在于可以实现真正的3D效果,而且无缝。更快的算法应该并非不可能,而且很可能已经有公司在致力于这件事情。

话说最近VR Porn很火,谁看谁知道。

新字号

出来混,招牌得擦亮点。在和skye姐苦苦探讨了半年之后,我们确定是起不出一个才气灵气霸气兼容并蓄的公司名字了。但时不我待,前些天终于鼓起勇气,大笔一挥糊了两个名字提交审核了。

我们最终的名字是

奇点视觉

奇点是指引力奇点。没啥含义,纪念下曾经的物理生涯。

注册公司目前只是为了方便眼前的一些事情。但如果将来不幸(或者有幸?),我要把这条路走到底,那我希望这是一家Wolfram Research那样的公司。赚钱养家只是人生中需要解决的问题之一,而非目的。我们首先解决这一问题,然后做一些有意思的事。这句话,我特别希望那些不慎掉入生活的泥淖的,折翼的物理(数学)男(女)们听到。

特此昭告天下。

若为自由故

两年前,加班到晚上十点的我打的回到嘉定南城空寂的两居室里,无意间从床底的灰尘里翻出一本书,Peskin的量子场论,书里的笔记仍如昨日,但封皮已经蒙尘。那时的床头经常青山乱叠,从场论到黑洞物理,却从来无暇读书。每天从公司回来倒头就睡,夜里书掉到地上,咕咚一声惊醒,沉淀了种种琐事的心头此刻无比清晰,我是谁,我本应该去做点什么。但终于有一天,它掉下去了,我没有醒来。

三年前我是一个理论物理方向的小研究生,生活在文献和据说叫做学术讨论的一种活动里。我想了解更多的事情,AdS/CFT,引力理论中的量子纠缠…后来我决定出逃,当你无法做自己想要做的事情,没必要去找一个虚假的安慰。

刚毕业那会儿兵荒马乱,最后找到了魔都的一家公司去做磁共振。创业公司的种种艰辛不需多说,每天深夜打电话叫的,不需报地址人家就知道你是哪家公司的。终归不是做自己喜欢的事,一年后智力和健康水平急剧下滑,离职。

我从小就曾思考自己将来的职业。成为物理学家?那是一个理想,如果走不通呢?互联网刚在大陆兴起时流行一个词儿,SOHO,自由职业,像所有理论物理方向的自由主义分子一样,这让我很向往。

2014年4月10日,我开始了解图像处理和计算机视觉。6月,把妹子从公司里拐出来,从广东迁徙回我们的第二故乡,一个北方的滨海小城。8月,我们有了第一个多路视频实时拼接产品。

这条路,我还算喜欢。

计算机这个年轻的学科算不上一个有深度的领域,但是它的确好玩。借助于前所未有的计算能力,有太多未知的可能等待人们去探索,而且这种探索,会几乎是实时的变成代码,以最廉价的方式给你试验结果。这种成就感是挺美的。

另一方面,它能够把数学、建模和逻辑能力很好地转换成物质收益,在这样一个社会,仰望星空的人应该首先有养活自己的能力。数千年来这个国家只靠沉思就可以生存的基本上只有和尚。我没事的时候仍然可以读点数学和物理,满足自己的好奇心,喜欢物理并非一定要到planck能区的荒原上冲锋陷阵。

这世界上充满了追逐基础科学(甚至是数学)而失意的理科人,据我所知,计算机和金融成为这类人最多的第二选择。我相信,每一个这样的同道,心中都有深藏的火焰,我们有好奇心,爱玩,喜欢创造出一个系统看它如愿运转起来所体验到的控制力与成就感,我们不甘于忍受旧世界的寡淡,不甘于日复一日毫无悬念的生活,不甘于自由被束缚。

基础科学或数学背景的人通常具有更高的眼光和高度的问题解决能力、学习能力,我相信这样的人最大的危险是被世界之大所稀释,所隔离。所以我想建立一个某种形式的社区,召集同道,或许可以互助,或许可以做些有趣的事情。

这项工作才刚刚开始,如果你是这样一个人,请加入我们的qq群

397499642