西西河

主题:【讨论】没人说说Sora吗? -- l696j

共:💬23 🌺108 🌵1 新:
全看树展主题 · 分页 下页
家园 【讨论】没人说说Sora吗?

最近各种媒体、自媒体、公众号、短视频,铺天盖地各种灰暗唱衰的消息,看起来是我们一天天糟糕下去,美国一天天蒸蒸日上,最新的证据就Sora的释出了。

各种裁员、降薪、A股下跌、低出生率、消费降级,各种各种。前天知道Sora,昨天就没睡好。

家园 稍安勿躁

去年此时炒作的是chatGPT,今年是sora,都是在我国的春节,是巧合吗?

不知道。

知道的是,我国都在休假,传得极快极广,于是各种药丸不断。

特别是去年chatGPT,声称它的各种“颠覆性”应用涉及面极广,当时说替代这个替代那个,完全不顾它的运行成本。一年过去了,到底能在哪些方面应用,自有其发展规律。

sora又是这样,各种“颠覆性”又来了。任泽平预测的“颠覆性”遭到一些网友嘲讽。

人工智能当然是必须认真对待。但一个新的应用还得看这个具体产品在商业上的表现

通宝推:赵美成,
家园 很好玩,很厉害,但不如那个能写程序的重要

也不如能检查程序的重要,而且没看出挣大钱的前景。

家园 不开放大众使用没法说

chatgpt厉害在他语言处理能力看得见摸得着,我记得当时很快就开放大家使用了。

sora现在不知道是什么成本、对画面的控制程度如何、生成视频的可用程度是多少,没法评价。

假设生成一段视频要一堆显卡跑半天,然后生成十几个几十个才能有1个可用,那恐怕没啥大用。

OpenAI放出来的视频里,那个黑衣服女子给我的印象最深,我感觉那个最“不AI”,还有很多反光。但问题在于,即使是那个视频,也有非常严重的错误——她的腿有极大的纰漏。

而就是这样“品质最高”的素材,最大的实际用途,大概也就是给营销号当“视频素材”的水平。

即使往外扩展一下,估计最“好用”的场景,也是制作某些公众人物的“黑材料”,因为其人物简单、场景又比较随机、不需要和其他食品内容互动。

-

如果他的功能是直接给已有画面做特效——比如以后拍RDJ一段视频,不需要经过任何特效公司,只要放到GPU里跑一圈,就能完美把RDJ替换成钢铁侠,那我觉得是更有前途的产品。

家园 看到一个说法

某个演示的视频,是一个咖啡杯里的两艘海盗船周旋,Sora生成每一帧波浪的图片,其实是通过无数个波浪视频,一帧一帧学出来,固然厉害,但还不算是大的突破。

真正的突破,是哪天AI学会了流体力学原理(强调一下是学会,不是预先编程),再根据这个原理,绘出那些波浪的图片,到了那天,人类就真的可以歇歇了

家园 chatGPT、sora跟美股的七朵金花都有关系

炒作人工智能概念可以提振道指纳斯达克指数,咱们跟这个风就没意思了,咱们沪深两市的人工智能板块股票都不成气候,只是方便了那些民营公司老板套现股票,咱们的七朵金花不是互联网科技公司,是石油金融与酱香型公司。

家园 每次都是这样,吹得神乎其神,仿佛天下没有它不知道的事

直到某天它吹到你的专业上。

家园 这些做媒体的不学无术,真以为做个视频就是生产力

做个ppt写个文档也叫生产力了,真是可笑。

家园 这次是真快了

它学不会流体力学,但它学会了前一帧和后一帧之间的关联。糊弄人眼睛估计够了。

迪斯尼是运动学软件开发大户。当年搞的一根根毛随风飘用的就是简化版的流体力学,但是计算量据说比拿个动物来拍贵多了。

sora相当于把两个概念结合起来,空间上的关联学习加上时间上的关联。它一个视频就是窗前一条狗,一群人走过去。厉害的是人离开之后狗还在。这就是时间关联的厉害之处。

这个sora我看很可能直接要用来变现了,不会给你玩了。像它那种“把里面背景给我换成中世纪”这种应用在电影这个领域都是百万起步的。可能未来特效师第一个下课了。

家园 SORA是2D+

加了流体力学的则是准3D的了,计算量当然不一样,但前途更广阔,可以更好的模拟世界了。

别的不敢说,对上海的乌克兰小模特恐怕打击会挺大的,估计一部分要改去教外语。

家园 感觉有时候国务院配合的可好了

国务院开会这么随意的吗?头一天看到一个新闻,马上就把会议给安排上了。咋我们单位开会是几个月前就定好议程的呢??

2月21日,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会。会议强调,中央企业要发展人工智能……加快布局和发展智能产业。

家园 去年这个时候猛吹chatGPT

然后我们知道chatGPT其实没啥大用。今年又开始猛吹什么Sora,这不是一回事嘛。放心好了,不是什么根本性的变革,而且现在美国干什么中国都能跟上,能跟上就行。

家园 是啊,这个比喻好

我最早学计算机的时候,最吃惊的一件事情就是,windows双击打开文件夹那个动作,实际上是2张图片快速切换,使得人类的眼睛看起来像是文件夹被打开了;

问题是,我们人类打开文件夹怎么能是2张图片间隔刷新呢?

所以,这么简单一个操作也是靠欺骗人类眼睛实现的;谁回追究说,双击打开文件夹其实压根儿就没有文件夹。

很多人非要追求人类的实现方式,事实是,机器实现了类似的效果。底层原理和人类完全不一样,但人类可以理解不就好。

尽管我这么多年来,每次双击打开文件夹的时候都会下意识的不去想这只是2张图片的刷新,但谁会在意这个呢?

家园 还没开放试用就各种吹了,看论文也就那么回事。
家园 我稍微说说吧

本来我也是三把刀,不想露怯。但是很多回答也太离谱了。

首先有个有名的ai 制图软件: stable ai。它的原理就是根据一部分图像推断另一部分。和图像除噪声差不多。简单说就是跟物理的diffusion类似推倒空间的联系。

另一个用到的技术叫transform。主要是处理一个序列的,也就是有先后次序的一串信息。比如说:语言。把一句话分解成一串词。然后变成一串数字。通过学习了解这些数字在顺序上有什么关联逻辑。ChatGPT很大程度就是这个东西。

Sora试图把这两个算法结合起来。把图像处理从空间和时间上进行推演:这不就是视频嘛。首先这也没那么原创,一堆工具了,没他长没他好。其次已经显示出的能力已经相当强悍了。真替特效师剪辑师灯光师担心。

不知道的是付出看多大算力的代价。那东西也是钱啊。

不过这个东西是肉眼可见的可变现。

全看树展主题 · 分页 下页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河