主题：【讨论】没人说说Sora吗？ -- l696j

共:💬23 🌺108 🌵1 新:

大浪淘沙

全看树展主题 · 分页下页

家园

【讨论】没人说说Sora吗？

最近各种媒体、自媒体、公众号、短视频，铺天盖地各种灰暗唱衰的消息，看起来是我们一天天糟糕下去，美国一天天蒸蒸日上，最新的证据就Sora的释出了。

各种裁员、降薪、A股下跌、低出生率、消费降级，各种各种。前天知道Sora，昨天就没睡好。

复【讨论】没人说说Sora吗？

家园

稍安勿躁

去年此时炒作的是chatGPT，今年是sora，都是在我国的春节，是巧合吗？

不知道。

知道的是，我国都在休假，传得极快极广，于是各种药丸不断。

特别是去年chatGPT，声称它的各种“颠覆性”应用涉及面极广，当时说替代这个替代那个，完全不顾它的运行成本。一年过去了，到底能在哪些方面应用，自有其发展规律。

sora又是这样，各种“颠覆性”又来了。任泽平预测的“颠覆性”遭到一些网友嘲讽。

人工智能当然是必须认真对待。但一个新的应用还得看这个具体产品在商业上的表现

通宝推：赵美成,

复【讨论】没人说说Sora吗？

家园

很好玩，很厉害，但不如那个能写程序的重要

也不如能检查程序的重要，而且没看出挣大钱的前景。

复【讨论】没人说说Sora吗？

家园

不开放大众使用没法说

chatgpt厉害在他语言处理能力看得见摸得着，我记得当时很快就开放大家使用了。

sora现在不知道是什么成本、对画面的控制程度如何、生成视频的可用程度是多少，没法评价。

假设生成一段视频要一堆显卡跑半天，然后生成十几个几十个才能有1个可用，那恐怕没啥大用。

OpenAI放出来的视频里，那个黑衣服女子给我的印象最深，我感觉那个最“不AI”，还有很多反光。但问题在于，即使是那个视频，也有非常严重的错误——她的腿有极大的纰漏。

而就是这样“品质最高”的素材，最大的实际用途，大概也就是给营销号当“视频素材”的水平。

即使往外扩展一下，估计最“好用”的场景，也是制作某些公众人物的“黑材料”，因为其人物简单、场景又比较随机、不需要和其他食品内容互动。

如果他的功能是直接给已有画面做特效——比如以后拍RDJ一段视频，不需要经过任何特效公司，只要放到GPU里跑一圈，就能完美把RDJ替换成钢铁侠，那我觉得是更有前途的产品。

复【讨论】没人说说Sora吗？

家园

看到一个说法

某个演示的视频，是一个咖啡杯里的两艘海盗船周旋，Sora生成每一帧波浪的图片，其实是通过无数个波浪视频，一帧一帧学出来，固然厉害，但还不算是大的突破。

真正的突破，是哪天AI学会了流体力学原理（强调一下是学会，不是预先编程），再根据这个原理，绘出那些波浪的图片，到了那天，人类就真的可以歇歇了

复稍安勿躁

家园

chatGPT、sora跟美股的七朵金花都有关系

炒作人工智能概念可以提振道指纳斯达克指数，咱们跟这个风就没意思了，咱们沪深两市的人工智能板块股票都不成气候，只是方便了那些民营公司老板套现股票，咱们的七朵金花不是互联网科技公司，是石油金融与酱香型公司。

复稍安勿躁

家园

每次都是这样，吹得神乎其神，仿佛天下没有它不知道的事

直到某天它吹到你的专业上。

复【讨论】没人说说Sora吗？

家园

这些做媒体的不学无术，真以为做个视频就是生产力

做个ppt写个文档也叫生产力了，真是可笑。

复看到一个说法

家园

这次是真快了

它学不会流体力学，但它学会了前一帧和后一帧之间的关联。糊弄人眼睛估计够了。

迪斯尼是运动学软件开发大户。当年搞的一根根毛随风飘用的就是简化版的流体力学，但是计算量据说比拿个动物来拍贵多了。

sora相当于把两个概念结合起来，空间上的关联学习加上时间上的关联。它一个视频就是窗前一条狗，一群人走过去。厉害的是人离开之后狗还在。这就是时间关联的厉害之处。

这个sora我看很可能直接要用来变现了，不会给你玩了。像它那种“把里面背景给我换成中世纪”这种应用在电影这个领域都是百万起步的。可能未来特效师第一个下课了。

复这次是真快了

家园

SORA是2D+

加了流体力学的则是准3D的了，计算量当然不一样，但前途更广阔，可以更好的模拟世界了。

别的不敢说，对上海的乌克兰小模特恐怕打击会挺大的，估计一部分要改去教外语。

复【讨论】没人说说Sora吗？

家园

感觉有时候国务院配合的可好了

国务院开会这么随意的吗？头一天看到一个新闻，马上就把会议给安排上了。咋我们单位开会是几个月前就定好议程的呢？？

2月21日，国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会。会议强调，中央企业要发展人工智能……加快布局和发展智能产业。

复【讨论】没人说说Sora吗？

家园

去年这个时候猛吹chatGPT

然后我们知道chatGPT其实没啥大用。今年又开始猛吹什么Sora，这不是一回事嘛。放心好了，不是什么根本性的变革，而且现在美国干什么中国都能跟上，能跟上就行。

复这次是真快了

家园

是啊，这个比喻好

我最早学计算机的时候，最吃惊的一件事情就是，windows双击打开文件夹那个动作，实际上是2张图片快速切换，使得人类的眼睛看起来像是文件夹被打开了；

问题是，我们人类打开文件夹怎么能是2张图片间隔刷新呢？

所以，这么简单一个操作也是靠欺骗人类眼睛实现的；谁回追究说，双击打开文件夹其实压根儿就没有文件夹。

很多人非要追求人类的实现方式，事实是，机器实现了类似的效果。底层原理和人类完全不一样，但人类可以理解不就好。

尽管我这么多年来，每次双击打开文件夹的时候都会下意识的不去想这只是2张图片的刷新，但谁会在意这个呢？

复【讨论】没人说说Sora吗？

家园

还没开放试用就各种吹了，看论文也就那么回事。

复【讨论】没人说说Sora吗？

家园

我稍微说说吧

本来我也是三把刀，不想露怯。但是很多回答也太离谱了。

首先有个有名的ai 制图软件： stable ai。它的原理就是根据一部分图像推断另一部分。和图像除噪声差不多。简单说就是跟物理的diffusion类似推倒空间的联系。

另一个用到的技术叫transform。主要是处理一个序列的，也就是有先后次序的一串信息。比如说：语言。把一句话分解成一串词。然后变成一串数字。通过学习了解这些数字在顺序上有什么关联逻辑。ChatGPT很大程度就是这个东西。

Sora试图把这两个算法结合起来。把图像处理从空间和时间上进行推演：这不就是视频嘛。首先这也没那么原创，一堆工具了，没他长没他好。其次已经显示出的能力已经相当强悍了。真替特效师剪辑师灯光师担心。

不知道的是付出看多大算力的代价。那东西也是钱啊。

不过这个东西是肉眼可见的可变现。

全看树展主题 · 分页下页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明