精品人妻无码一区二区三区狼群_国产综合精品中文字幕免费_天天草综合_综合色天天伊人热卡_台湾狼客色中文娱乐网_国产AV国片精品A片_成人免费无码精品国产网站_婷婷蜜导航国产精品_大地电影资源第二页中文在线观看官网

新聞資訊
News
舞臺(tái)設(shè)備模型 2023年的人工智能:應(yīng)用層已經(jīng)到來
144 作者:拓豐舞臺(tái) 2023-08-03 09:00:34

神譯局是36氪旗下編譯團(tuán)隊(duì),關(guān)注科技、商業(yè)、職場、生活等領(lǐng)域,重點(diǎn)介紹國外的新技術(shù)、新觀點(diǎn)、新風(fēng)向。

編者按:很多人都預(yù)測 2023 年將是 AI 之年。但 AI 顯然不是今年才開始爆發(fā)或者炒作起來的。但是 2022 年圖像生成工具以及聊天工具 ChatGPT 等消費(fèi)者化是人工智能開始普及應(yīng)用的標(biāo)志,2023 年這股趨勢只會(huì)愈演愈烈。本文剖析了 AI 的用例與商業(yè)模式,也許我們將迎來繼農(nóng)業(yè)革命、工業(yè)革命以來的第三種通用技術(shù)的普及。文章來自編譯。

現(xiàn)在 AI 令人興奮的一點(diǎn)是平臺(tái)層正在固化,這意味著應(yīng)用層該出現(xiàn)了。換句話說,也就是你我每天都會(huì)接觸到的東西該出現(xiàn)了。

過去這幾個(gè)月的時(shí)間里,我已經(jīng)寫了好幾篇與 AI 正在發(fā)生的事情有關(guān)的文章。鑒于這是我們進(jìn)入 2023 年要面對(duì)的技術(shù)主題,在此我想把那些文章都整合一下,寫一篇深度探討的文章,然后進(jìn)一步拓展。

其結(jié)果是這篇文章的篇幅要長很多,但在關(guān)于我們現(xiàn)在處在什么位置的事情上,我希望它能提供一份類似‘國情咨文’的快照舞臺(tái)設(shè)備模型,同時(shí)就“我們未來要去哪里”給出一些提示。

讓我們開始吧。

每當(dāng)我思考人工智能領(lǐng)域在發(fā)生著什么時(shí),我往往會(huì)想到兩部電影。一部是 33 年前問世的老片,一部是 10 個(gè)月前問世的新片。

1990 年上映的《超國度》(Hyperland)幾乎已被人遺忘。這部科幻電影的導(dǎo)演是道格拉斯·亞當(dāng)斯 (Douglas Adams),他更出名的身份是《銀河系搭車客指南》的作者。電影的假設(shè)是亞當(dāng)斯對(duì)被動(dòng)式的線性電視已經(jīng)厭煩了,電影稱就是“那種發(fā)生在你身上,而你就像一個(gè)沙發(fā)土豆一樣坐在它面前沙發(fā)視?!?/p>

為了尋找更具互動(dòng)性的媒體形式,亞當(dāng)斯把他的電視帶到了一個(gè)垃圾場,在那里他遇到了湯姆(由湯姆·貝克飾演)。湯姆是一位軟件代理——本質(zhì)上屬于一個(gè)數(shù)字管家,能夠根據(jù)你的特定興趣為你提供個(gè)性化的信息和娛樂飲食。湯姆帶領(lǐng)我們的主人公穿行于一個(gè)超媒體的虛擬世界——一個(gè)由鏈接的文本、聲音、圖像和視頻組成的世界。換句話說,湯姆帶著亞當(dāng)斯踏上了互聯(lián)網(wǎng)之旅。(或者說得更具體一點(diǎn),是穿行于一個(gè)漫長而曲折的兔子洞,跟維基百科類似——但比維基百科的出現(xiàn)早了 11 年)。

《超國度》,尤其是湯姆這個(gè)角色,讓我想到了我們目前的現(xiàn)實(shí):人工智能驅(qū)動(dòng)的算法推薦引擎,根據(jù)我們獨(dú)特的興趣圖譜塑造出的一個(gè)超個(gè)性化的互聯(lián)網(wǎng)。這就是我所說的“一切都被 TikTok 化”。(David Karpf 提出了一個(gè)很有智慧的看法,即超國度與現(xiàn)代之間有一個(gè)關(guān)鍵區(qū)別:在電影里面,是你在控制算法;當(dāng)然,現(xiàn)如今的算法已經(jīng)過優(yōu)化,可以替開發(fā)和部署它們的公司賺錢。)

我想到的第二部電影面世的時(shí)間要近得多:2022 年 3 月的《瞬息全宇宙》,在我看來,這有可能是今年奧斯卡最佳影片的潛在競爭者。 在我最近的記憶中,《瞬息全宇宙》屬于線索比較混亂的電影之一。這部電影講述的是伊芙琳(楊紫瓊飾)的故事,她是一名中國移民,經(jīng)營著一家正在接受美國國稅局審計(jì)的自助洗衣店。伊芙琳很快發(fā)現(xiàn),她生活在無限宇宙里面的一個(gè)宇宙,她必須穿越多重宇宙才能拯救她的家人。

從很多方面來說,這部電影都是對(duì)互聯(lián)網(wǎng)之亂的隱喻。在接受 Slashfilm 的采訪時(shí),電影導(dǎo)演之一的丹尼爾·謝納特(Daniel Scheinert)是這么說的:“我們希望這部電影的極簡主義能夠與沒完沒了地刷屏的感覺建立關(guān)聯(lián)”。

YouTuber Thomas Flight(對(duì)這部電影做出了出色的分析)稱《瞬息全宇宙》是第一批“后互聯(lián)網(wǎng)”電影之一,因?yàn)樗蹲降搅嗽诰€生活的怪異之處。生活在 2023 年的迷人的一點(diǎn)在于,我們的大腦與一個(gè)世紀(jì)前相比沒有什么不同(事實(shí)證明,進(jìn)化需要很長時(shí)間),但我們的世界在 100 年內(nèi)卻發(fā)生了翻天覆地的變化。正如 Flight 所說的那樣:“我們現(xiàn)在生活在這樣一個(gè)時(shí)代,在一次 30 分鐘 TikTok 狂歡里,我們體驗(yàn)到的有趣想法、概念、人物以及地方,就要比我們被困在當(dāng)?shù)啬坎蛔R(shí)丁的祖先一輩子所經(jīng)歷過的東西都要豐富。”快速演變的數(shù)字混沌會(huì)如何扭曲我們緩慢進(jìn)化的人類思維呢?

《瞬息全宇宙》里面的宇宙是多種多樣的,而且非常非常的奇怪。在一個(gè)沒有人類生命的宇宙里,每個(gè)人都是一動(dòng)不動(dòng)的石頭。里面還有一個(gè)宇宙,這個(gè)宇宙里面每個(gè)人都是蠟筆畫。另一個(gè)宇宙里,每個(gè)人的手指都變成了熱狗(我告訴過你這很奇怪)。

《瞬息全宇宙》這部電影捕捉到了互聯(lián)網(wǎng)的運(yùn)動(dòng)能量與無情的節(jié)奏。

不過,這部電影讓我想到的不是互聯(lián)網(wǎng),而是生成式人工智能正在發(fā)生的事情。就像電影讓主人公將她想象中的任何東西都轉(zhuǎn)化為有形的現(xiàn)實(shí)一樣,生成式 AI 也讓我們將想法變成了文字、圖像和視頻。

這是當(dāng)我輸入提示“A person made entirely of fruit”(一個(gè)完全由水果組成的人)時(shí) Midjourney 生成的結(jié)果:

這是我輸入“New York City skyline in the style of Van Gogh”(梵高風(fēng)格的紐約市天際線)時(shí)得到的結(jié)果:

我可以花幾個(gè)小時(shí)(而且我已經(jīng)花了幾個(gè)小時(shí))去試驗(yàn)這樣的提示。

2022 年取得突破的生成式人工智能是自十多年前移動(dòng)和云計(jì)算興起以來最引人注目的技術(shù)。平臺(tái)層正在鈣化,我們正目睹著令人興奮的應(yīng)用層的萌芽——這些產(chǎn)品有可能成為數(shù)十億人日常生活的一部分。

這篇文章的目的是研究 AI 這一時(shí)刻背后的“為什么是現(xiàn)在”,并探索初創(chuàng)企業(yè)可以如何利用 AI來進(jìn)行開發(fā)。本文內(nèi)容將分為以下幾部分:

搭好舞臺(tái) 算法推薦系統(tǒng) 圖像模型 語言模型 生成式人工智能的用例 商業(yè)模式 最后思考及待回答的關(guān)鍵問題

好了,讓我們開始吧。

搭好舞臺(tái)

在過去十年里,有兩股重要力量推動(dòng)了技術(shù)的發(fā)展:分別是移動(dòng)和云計(jì)算。

移動(dòng)促進(jìn)了大型消費(fèi)互聯(lián)網(wǎng)公司的崛起:Uber 與 Lyft、Instagram 與 Snap、Robinhood 與 Coinbase 。這些公司基本上都成立于 2009 年至 2013 年間。數(shù)字廣告在 2010 年代迅速轉(zhuǎn)向移動(dòng)設(shè)備,F(xiàn)acebook 等桌面時(shí)代的公司不得不爭先恐后地重塑業(yè)務(wù)。

明年移動(dòng)應(yīng)用內(nèi)廣告的支出預(yù)計(jì)將超過桌面廣告 - Marketing Charts

云計(jì)算則支撐了軟件即服務(wù) ( SaaS ) 的爆發(fā)式增長,并讓數(shù)據(jù)變成企業(yè)最寶貴的資源(“數(shù)據(jù)就是新的石油”云云)。這一領(lǐng)域的新興公司基本上也都成立于 2009 年至 2013 年之間,其中包括 Slack 與 Airtable 、Stripe 與 Plaid、Snowflake 與 Databricks 等。

從 2015 年到 2022 年間,存儲(chǔ)在云端的企業(yè)數(shù)據(jù)占比翻了一番:

存儲(chǔ)在云端的企業(yè)數(shù)據(jù);資料來源: Statista

這是過去 10 年 AWS 收入情況圖,很少有圖表比這幅圖更令人印象深刻(利潤率高達(dá) 35%?。?/p>

AWS 收入($B);資料來源: Statista

移動(dòng)和云計(jì)算讓 2010 年代成為技術(shù)領(lǐng)域非常非常好的十年。但在過去的幾年里,我們看到很多人都在嚷嚷接下來會(huì)發(fā)生什么。虛擬現(xiàn)實(shí)?增強(qiáng)現(xiàn)實(shí)?自動(dòng)駕駛汽車? 加密貨幣?Web 3?

這些技術(shù)個(gè)個(gè)都很有趣,原因各不相同,有趣的用例也各異,但都還非常非常早。整個(gè) VR 行業(yè)僅相當(dāng)于蘋果 2021 年?duì)I收的 2%。(雖然隨著蘋果即將推出的混合現(xiàn)實(shí)頭顯,情況可能會(huì)有所改變。)圍繞新技術(shù)的炒作太多,而源于對(duì)移動(dòng)和云計(jì)算的焦慮的“平臺(tái)轉(zhuǎn)變”已經(jīng)……過時(shí)了。 AWS 推出時(shí)間是 2006 年; iPhone 在 2007 年問世。移動(dòng)和云計(jì)算都還沒有飽和,但它們的新機(jī)遇并不像以前那樣成熟了。與此同時(shí),我們看到前所未有的私有資本開始涌入,去追逐創(chuàng)業(yè)公司:

風(fēng)投資金在 2021 年激增至 3300 億美元

舞臺(tái)設(shè)備模型_模型舞臺(tái)設(shè)備圖片_模型舞臺(tái)設(shè)備廠家

2020 年代最引人注目且最有可能推動(dòng)技術(shù)發(fā)展的力量是什么?也許是人工智能。人工智能在過去幾年中得到了顯著改善。直到最近,Gmail 的自動(dòng)補(bǔ)充句子功能幾乎還沒法用;但現(xiàn)在已經(jīng)好得嚇人。Facebook 用戶將認(rèn)識(shí)到 AI 在識(shí)別照片里面的朋友方面已變得有多么出色;實(shí)際上,F(xiàn)acebook 的 DeepFace 引擎現(xiàn)在比人類還要擅長面部識(shí)別。就在去年夏天,我們看到了從 Stable Diffusion 到 Midjourney、ChatGPT 到 Lensa 的一切事物的涌現(xiàn)。人工智能正在成為主流。

Facebook 的DeepFace現(xiàn)在比人類還要擅長面部識(shí)別

我們正處在人工智能的轉(zhuǎn)折點(diǎn)(原因稍后會(huì)詳細(xì)介紹),這個(gè)轉(zhuǎn)折點(diǎn)正在支撐起創(chuàng)新的寒武紀(jì)大爆發(fā)。2009 年至 2013 年誕生了數(shù)十家由移動(dòng)和云計(jì)算技術(shù)提供支持的變革型初創(chuàng)公司。未來幾年這樣的公司將再度涌現(xiàn),但這次,人工智能將成為催化劑。

前一段時(shí)間,有位朋友問了我一個(gè)問題:AI 是泡沫,還是下一個(gè)大事件?答案可能是兩者兼而有之。

現(xiàn)在有很多令人興奮的事情,其中很多是有理由的,但其中很多可能是非理性的、不成熟的,或者兩者兼而有之。但是當(dāng)你將畫面拉遠(yuǎn)時(shí)就能發(fā)現(xiàn),毫無疑問我們正處于一個(gè)激動(dòng)人心的技術(shù)新時(shí)代的風(fēng)口浪尖。

算法推薦系統(tǒng)

最近的大部分討論都圍繞著生成式人工智展開,但“傳統(tǒng)”的人工智能仍有很大的發(fā)展空間。曝光度最高的人工智能應(yīng)用是什么?也許沒有比 TikTok 的For You Page(為你推薦)更高的了,對(duì)于《超國度》那個(gè)具有先見之明的超個(gè)性化的互聯(lián)網(wǎng)來說,這可以說是它最好的現(xiàn)代類比。

TikTok 沉浸式、算法性的 For You Page 開創(chuàng)了內(nèi)容策劃的新風(fēng)尚。一開始,每個(gè)發(fā)布出去的視頻都會(huì)被推送給一組的初始受眾,然后根據(jù)他們觀看了多長時(shí)間、是否喜歡視頻、是否對(duì)視頻發(fā)表了評(píng)論等等,對(duì)這些觀眾的反應(yīng)進(jìn)行評(píng)估。如果受眾反應(yīng)良好,視頻就會(huì)被推送給更多的受眾,如此循環(huán)往復(fù)。

TikTok的算法

我最近跟同事 Martin 討論了一下移動(dòng)和云計(jì)算之后技術(shù)的下一步會(huì)是什么。我們聊起了 AI,并回想起十年前那張著名的“解綁 Craigslist”的圖表。

就是這張圖:

將業(yè)務(wù)從Craigslist解綁出來誕生了大批初創(chuàng)企業(yè),迄今為止這批企業(yè)的融資額達(dá)到了88.7億美元 資料來源:CB Insights

這里還有一張,要表達(dá)的概念是一樣的,但更清晰:

平臺(tái) Vs 垂直領(lǐng)域及下一個(gè)大解綁 | Andreessen Horowitz 圖片來源:Andrew Parker

這些圖有一個(gè)基本前提,那就是原先市場的主要品類正在被更專注、更好的產(chǎn)品所重塑。通常,顛覆者會(huì)利用某項(xiàng)新技術(shù):比方說,Tinder 是第一批只支持移動(dòng)設(shè)備的約會(huì) app 之一。

AI 應(yīng)用可能也會(huì)帶來類似的清算。主要的品類——如約會(huì)、房地產(chǎn)、求職等——可能會(huì)因?yàn)橛腥四芨玫乩萌斯ぶ悄芏粡氐最嵏?。?dāng) AI 可以把跟你完美匹配的對(duì)象呈現(xiàn)出來時(shí),為什么還要上 Tinder 沒完沒了地刷屏?十年之后,我們可能會(huì)看到上圖有了一個(gè)新版本,里面出現(xiàn)的也許是全新的公司 logo——AI 優(yōu)先的公司會(huì)重塑每一個(gè)品類。當(dāng)然了,生成式人工智能一定會(huì)從中發(fā)揮作用,但類似 TikTok 的推薦系統(tǒng)也很強(qiáng)大;就數(shù)字世界將越來越適合我們的獨(dú)特品味和偏好而言,我們?nèi)蕴幱谠缙陔A段。

讓我們看個(gè)例子——交易。

從很多方面來說,SHEIN 都算是 TikTok 的姊妹公司。SHEIN 與字節(jié)跳動(dòng)(TikTok 的母公司)都是中國公司,而且位列全球最有價(jià)值的三大初創(chuàng)公司之一(字節(jié)跳動(dòng)排名第一,美國的 SpaceX 排名第二,SHEIN 排名第三)。

就像 TikTok 滲透了美國的媒體一樣,SHEIN 也打入到美國的快時(shí)尚——

美國快時(shí)尚市場Shein占據(jù)了最大的份額 - Bloomberg Second Measure

這張圖換了個(gè)視角,把 SHEIN 與 H&M 和 Zara 的銷售額進(jìn)行比較:

中國快時(shí)尚品牌Shein如何征服美國市場 -

SHEIN 的爆發(fā)式增長非常引人注目:SHEIN 已經(jīng)連續(xù)八年(?。┟磕甑脑鲩L率都超過 100%,其在非公開市場的最新估值已經(jīng)超過 Zara 和 H&M 市值之和。2022年 6 月,SHEIN 取代亞馬遜,成為 iOS 和 Android 應(yīng)用商店排名第一的購物應(yīng)用。

SHEIN 的速度令人矚目:這里每天都要上架 8000 件新商品,而 Zara 每周才新增 500 件。SHEIN 基本上屬于互聯(lián)網(wǎng)原生的 Zara 和 H&M 轉(zhuǎn)世,利用了更好的技術(shù)把從設(shè)計(jì)到生產(chǎn)的時(shí)間從三周壓縮到了三天。SHEIN 通過梳理競爭對(duì)手的網(wǎng)站和 Google Trends,找出流行的款式,然后快速做出自己的設(shè)計(jì),預(yù)測需求,實(shí)時(shí)調(diào)整庫存。

我們?cè)僬f回 AI,SHEIN 給我留下的其中一個(gè)深刻印象是它的推薦。就像字節(jié)跳動(dòng)會(huì)預(yù)測你想看的內(nèi)容一樣,SHEIN 會(huì)預(yù)測你想買什么衣服。SHEIN 之于電商就像字節(jié)跳動(dòng)之于內(nèi)容。

這個(gè)周末,為了給朋友即將舉行的 30 歲生日聚會(huì)準(zhǔn)備東西,我打算到網(wǎng)上購物。這個(gè)派對(duì)以《亢奮》(Euphoria)為主題舞臺(tái)設(shè)備模型,也就是說,基本上你得穿得像 HBO 那部美劇的里 Maddie 、Cassie 或 Nate Jacobs 一樣。我之前從來都沒上 SHEIN 買過東西,但我輸入了“男士黑色網(wǎng)紗上衣”來找衣服。然后我點(diǎn)擊了“褲子”品類,結(jié)果看到了這個(gè)屏幕:

只是搜索了一次網(wǎng)紗上衣,SHEIN 就能夠預(yù)測出風(fēng)格和主題非常相似的褲子。這非常令人印象深刻。(還有,請(qǐng)不要以為這些就是我平時(shí)穿的衣服。)

從某種程度來說,這是 Stitch Fix 開創(chuàng)的個(gè)人造型訂閱盒概念的更復(fù)雜版本。Stitch Fix 給整個(gè)過程引入了人,也利用了數(shù)據(jù)科學(xué),但其基礎(chǔ)是新客戶引導(dǎo)冗長的問卷調(diào)查。而 SHEIN 只根據(jù)我輸入的四個(gè)詞(也許還參考了我點(diǎn)擊的內(nèi)容、鼠標(biāo)懸停的位置等數(shù)據(jù))就做出了準(zhǔn)確的推薦。

Stitch Fix 的個(gè)人造型市場已被證明相對(duì)小眾,而且它的股票也已受到重創(chuàng)?;钴S客戶已降至 390 萬,同比下降 20 萬人(下降 5%)。該公司正在努力向 Freestyle 產(chǎn)品轉(zhuǎn)型——這是一種更傳統(tǒng)的購物體驗(yàn)——但這個(gè)細(xì)分市場仍然只占該公司業(yè)務(wù)的一小部分。

Stitch Fix 的訂閱盒里面是由造型師和數(shù)據(jù)科學(xué)策劃的推薦產(chǎn)品

盡管 Stitch Fix 舉步維艱,但它的目標(biāo)是突破性的——個(gè)性化商務(wù)。這家公司幾年前就提出了這個(gè)概念,但當(dāng)時(shí)人工智能還不夠成熟,沒法取代冗長的問卷調(diào)查以及小規(guī)模的數(shù)據(jù)科學(xué)家隊(duì)伍。SHEIN 朝著正確方向邁出了一步,但我們?nèi)哉驹谌斯ぶ悄茯?qū)動(dòng)推薦的風(fēng)口浪尖。

舞臺(tái)設(shè)備模型_模型舞臺(tái)設(shè)備廠家_模型舞臺(tái)設(shè)備圖片

想象一下,如果有家公司能梳理你的相機(jī)膠卷,并以驚人的準(zhǔn)確性為你推薦一大批新衣服會(huì)怎樣?或者,也許這家公司只需要請(qǐng)你將 Instagram 帳戶關(guān)聯(lián)一下,然后就能消化你的所有點(diǎn)贊和關(guān)注,即可提供極其準(zhǔn)確、個(gè)性化的時(shí)尚推薦。

人工智能的主要消費(fèi)者應(yīng)用將大量依賴于嫻熟的推薦。這些推薦能預(yù)測到連你都不知道的需求與愿望——就像 TikTok 的 For You Page 一樣:它能夠在人們自己還沒意識(shí)到之前就向?qū)Ψ奖砻魉麄兪切陨贁?shù)者。也許上面的示例公司可以在一條 FYP(For You Page)動(dòng)態(tài)消息中重塑商業(yè),讓你每次瀏覽一個(gè)精心策劃的商品——雙擊即可購買,向上滑動(dòng)即可查看下一件東西。

世界正在向著個(gè)性化轉(zhuǎn)變,而人工智能是在給這股趨勢火上澆油。我的朋友 Alex 說的一席話我很喜歡:

在AI的幫助下,一對(duì)一輔導(dǎo)正在成為可能

突然之間,“一對(duì)一”體驗(yàn)可以大規(guī)模復(fù)制了——與我們?cè)谖磥韼啄昕吹降膽?yīng)用相比,今天的 AI 應(yīng)用仍處在初級(jí)階段。想想看,上面的每一個(gè) Craigslist 類別——教育、書籍、家居裝飾等。每一個(gè)都即將被重塑。

圖像模型

2022 年文本生成圖像 AI 爆發(fā)了。首先出現(xiàn)的是來自 OpenAI 的 DALL-E (這個(gè)名字綜合了藝術(shù)家薩爾瓦多·達(dá)利以及皮克斯的那部動(dòng)畫片,《機(jī)器人瓦力》,WALL-E)。當(dāng)然,不是誰都可以直接用 DALL-E,但這方面的創(chuàng)作已經(jīng)開始在互聯(lián)網(wǎng)上火起來了;Twitter 上面我最喜歡的賬號(hào)是 Weird DALL-E Generations。

互聯(lián)網(wǎng)上用DALL-E 生成 11 張最奇怪的圖像 | Mashable

對(duì)于這個(gè)世界大部分的地區(qū)來說,DALL-E 是 AI 的第一個(gè)真正的“哇哦”時(shí)刻。在與麻省理工學(xué)院交流時(shí),OpenAI 的 Sam Altman 把這一點(diǎn)歸功于圖像所傳遞的情感力量:

我想說的是,其實(shí)相對(duì)于 DALL-E,技術(shù)界對(duì) 2020 年推出的 GPT-3 要更加認(rèn)可。 從 GPT-3這里,你第一次真正感受到了系統(tǒng)的智能。它可以做人做的事情。我認(rèn)為它的出現(xiàn)讓以前根本不相信 AGI [通用人工智能] 的人也要認(rèn)真對(duì)待這一話題了。發(fā)生在 GPT-3 身上的有些事情是我們大家都沒預(yù)料到的。

但是圖像卻有著獨(dú)特的情感力量。相對(duì)于 GPT-3 ,世界其他地方對(duì) DALL-E 的欣賞要高很多。

人往往更喜歡更豐富的媒體格式:Instagram (主要媒體是照片)一直都比 Twitter(以文字為主)更受歡迎;與此同時(shí),TikTok (主要是視頻)在使用上一直在蠶食 Instagram 的市場,迫使后者也得向視頻轉(zhuǎn)型(通過 Reels )。在我看來,類似的偏好也會(huì)發(fā)生在生成式人工智能身上:圖像 > 文本,很快,視頻也會(huì) > 圖像,以及最終沉浸式 3D 體驗(yàn)將 > 視頻。(消費(fèi)者偏好的這一事實(shí)也是我從長遠(yuǎn)看繼續(xù)看好 VR 和 AR 的原因。)

在 DALL-E 起勢之后,去年夏天 Stable Diffusion 和 Midjourney 的出現(xiàn)徹底改變了局面。Stable Diffusion 具有開創(chuàng)性,因?yàn)樗情_源的,這意味著開發(fā)者基于它做開發(fā)。稍微解釋一下,Stable Diffusion 將擴(kuò)散從像素空間轉(zhuǎn)移到了潛在空間,從而推動(dòng)了質(zhì)量的顯著提高。(如果你感興趣的話,可以看看這一篇文章。)與此同時(shí),Midjourney在可訪問性方面具有開創(chuàng)性。Discord 上就能使用 Midjourney :任何人都可以注冊(cè)一個(gè)免費(fèi)賬號(hào),并獲得 25 個(gè)積分,圖像則是用公共服務(wù)器生成的。用完 25 個(gè)積分之后,每月支付 10 美元或 30 美元就可以繼續(xù)使用(具體多少錢取決于你要?jiǎng)?chuàng)作的圖像數(shù)量以及你是否希望生成的圖像保持私密)。Midjourney 已迅速成為 Discord 上最受歡迎的服務(wù)器之一(也許是最受歡迎的服務(wù)器?),擁有 740 萬會(huì)員。

下圖是 Midjourney、DALL-E 2 以及 Stable Diffusion 在使用相同的文本提示時(shí)生成的圖像,各自風(fēng)格略有不同:

下面這條時(shí)間線從更寬泛的角度展示了 AI 圖像生成在過去十年是如何得到改進(jìn)的(請(qǐng)留意近年來提示的復(fù)雜性的不斷增加,以及輸出的保真度在不斷提高):

去年是圖像模型的轉(zhuǎn)折點(diǎn),生成的圖像質(zhì)量得到了迅速提高。舉個(gè)例子:眾所周知,AI 很不擅長創(chuàng)作手。除非 AI 具有出色的上下文感知能力,否則很難知道已經(jīng)弄出了多少根手指。其結(jié)果是我們最終會(huì)得到很多有四根或六根手指的手。下圖是 Midjourney v3(2022 年 7 月)與 Midjourney v4(2022 年 11 月)生成結(jié)果的對(duì)比,你能看出結(jié)果有了明顯改進(jìn):不再會(huì)出現(xiàn)有兩只喙或三條腿的企鵝。

當(dāng)我想到圖像生成早期遇到的挑戰(zhàn)時(shí),就會(huì)回想起一個(gè)世紀(jì)前動(dòng)畫在早期面臨的挑戰(zhàn)。米老鼠為什么要戴手套?原因之一是這樣制作動(dòng)畫可以更快;手是很難畫的?!堵斆鞅坎罚‵red Flintstone) 和 喬治·杰森(George Jetson)也是如此——你看不見他們的脖子,因?yàn)橛胁弊右馕吨巧恼麄€(gè)身體都得跟隨每個(gè)動(dòng)作和表情而移動(dòng)。這意味著動(dòng)畫師要做更多的工作。領(lǐng)帶和高領(lǐng)讓動(dòng)畫師得以投機(jī)取巧,加快制作動(dòng)畫的速度。

杰里·鄧肯(Jerry Duncan)與聰明笨伯交談 - Dean Kaner,《幽默時(shí)代》

當(dāng)然了,半個(gè)世紀(jì)之后,動(dòng)畫已經(jīng)取得了長足進(jìn)步?!逗5卓倓?dòng)員》在某種程度上是皮克斯展示自己可以制作出逼真的水動(dòng)畫的借口?!豆肢F電力公司》里面的形象也是如此。皮克斯一直等到第 6 部動(dòng)畫片《超人總動(dòng)員》才第一次開始描寫人類的故事,因?yàn)?CGI 技術(shù)之前還沒有為此做好準(zhǔn)備(指玩具總動(dòng)員)之所以專門講玩具,部分是因?yàn)槠た怂惯€不能對(duì)逼真的人類細(xì)節(jié)進(jìn)行渲染——所以在電影中你幾乎看不見安迪和他媽媽的影子)。

數(shù)字創(chuàng)作的軌跡正在沿著動(dòng)畫的軌跡前進(jìn),但技術(shù)發(fā)展的步伐只會(huì)越來越快。比方說,上面 Midjourney 生成的企鵝圖像之間的差異只是短短幾個(gè)月之間的對(duì)比結(jié)果。

語言模型

《黑鏡》第二季的《馬上回來》(Be Right Back)講的是一對(duì)夫妻一起搬進(jìn)了新家。結(jié)果第二天,丈夫出車禍身亡了。后來他的遺孀得知有一項(xiàng)新服務(wù)可以讓她與已故的丈夫聊天;這款工具能夠消化短信以及社交媒體的歷史記錄,從而了解伴侶會(huì)如何回應(yīng),然后代替他與客戶聊天。這一集(2013 年播出)的情節(jié)現(xiàn)在已經(jīng)成為現(xiàn)實(shí)。在針對(duì)個(gè)人數(shù)據(jù)進(jìn)行訓(xùn)練的基礎(chǔ),初創(chuàng)企業(yè) HereAfter.ai 就提供了與已故親屬的互動(dòng)化身聊天的服務(wù)。

去年,在圖像模型出現(xiàn)飛躍的同時(shí),語言模型也突飛猛進(jìn)。去年 11 月, OpenAI 推出了 ChatGPT ,剛推出五天,這款聊天工具就收獲了 100 萬用戶。ChatGPT 的表現(xiàn)令人難以置信;使用它的感覺跟你第一次用上 Google Search 一樣,都有“魔法時(shí)刻”降臨的感覺。(每次使用 ChatGPT 時(shí),我都會(huì)想起亞瑟·克拉克的名言:“任何足夠先進(jìn)的技術(shù)都與魔法無異?!保?/p>

下面的一些例子說明了 ChatGPT 能做什么:

提示:“什么是蟲洞?把我當(dāng)作 5 歲小孩給我解釋一下?!?/p>

讓chatgpt用通俗易懂的方式解釋蟲洞

提示:“提供一個(gè) 29 歲生日派對(duì)的創(chuàng)意?!?/p>

使用 chatGPT提出派對(duì)創(chuàng)意

提示:“用伴奏的和弦寫一首關(guān)于在家工作的歌曲。”

讓 chatgpt用和弦寫音樂

人工智能現(xiàn)在這種發(fā)展和采用的節(jié)奏可以追溯到 2017 年當(dāng)時(shí)谷歌發(fā)表的一篇開創(chuàng)性論文,《Attention Is All You Need》。這篇論文由 Cohere.ai 創(chuàng)始人 Aidan Gomez 與人合著,從中催生出一個(gè)規(guī)模呈指數(shù)級(jí)增長的“transformer”模型時(shí)代。

不到三年前的 GPT-3 推出時(shí)的參數(shù)規(guī)模為約 2000 億,但新的 GPT-4 將有約 1,000,000,000,000(萬億)個(gè)參數(shù)。

新疆拓豐舞臺(tái)設(shè)備工程有限公司主要從事舞臺(tái)機(jī)械、舞臺(tái)幕布的生產(chǎn)安裝。其中舞臺(tái)機(jī)械包括:臺(tái)上機(jī)械、臺(tái)下機(jī)械、升降舞臺(tái)、伸縮舞臺(tái)、旋轉(zhuǎn)舞臺(tái)、活動(dòng)假臺(tái)口、燈光吊籠、燈光吊片、對(duì)開幕布系統(tǒng)、電影銀幕架、升降系統(tǒng)、電動(dòng)吊桿機(jī)、多層纏繞吊桿機(jī)、單點(diǎn)吊桿機(jī)、單層纏繞吊桿機(jī)、一次排繩臥式、立式滾筒式電動(dòng)吊桿機(jī)、變頻調(diào)速拉幕機(jī)、電動(dòng)對(duì)開拉幕機(jī);阻燃舞臺(tái)幕布有:大幕、二幕、會(huì)幕、紗幕、天幕、橫側(cè)條幕等,是國內(nèi)較早規(guī)模較大的舞臺(tái)設(shè)備制造企業(yè)。