1. <ruby id="2nt17"><table id="2nt17"></table></ruby><listing id="2nt17"><thead id="2nt17"></thead></listing>
    <ruby id="2nt17"><table id="2nt17"></table></ruby>
    <strong id="2nt17"></strong>
    <li id="2nt17"></li>

        1. 對話王小川:大模型創業核心,是想好技術如何匹配產品

          摘要

          AI 原生應用,必須能提供 10 倍好的體驗,讓用戶「用得爽」。

          作者 | 宛辰、Moonshot

          編輯 | 靖宇

          過去八個月,百川智能團隊依托對搜索、高質量數據處理等 AI 技術積累,在模型尺寸、質量上迅速迭代。百川智能創始人、CEO 王小川認為,百川應該在「理想上慢半步,落地上快三步」。

          2023 年 12 月 16 日,在極客公園創新大會 2024 的現場,王小川進一步分享了大模型的新思考。

          對于大模型的演進方向,王小川認為,目前大模型是「學」,但是「不思」,接下來模型演進的方向是把「學」和「思」要合在一起。而大模型時代做應用,必須考慮大模型技術的特點,這是過去做產品和現在最大的不同。

          「過去做應用,老講產品和市場之間的匹配——PMF(Product Market Fit,產品市場匹配),但產品和市場之外把一個詞丟掉了,技術?!?/p>

          他認為,當前的大模型技術距離 AGI 還比較遠,這種不完美的前提下更要明確:「這樣一個技術適合什么樣的產品」,而不是產品經理洞察市場,回來就開始做。

          在王小川看來,大模型帶來的新的開發范式下,產品經理的出發點,應該從思考產品市場匹配(PMF),到思考技術與產品的匹配怎么做,即 TPF(Technology Product Fit,技術產品匹配)。

          一個大模型應用,怎么才算成功,王小川認為首先是能提供比傳統應用好十倍的體驗,用戶能「用得爽」。而要做出這樣的應用,產品經理不僅首先自己要是大模型的狂熱粉絲,而且還既要有傳統產品經驗,又有想象力,能夠想出大模型長什么樣。

          以下為王小川極客公園創新大會 2024 對話實錄

          01 大模型的「學」和「思」

          張鵬:你來過我們大會很多次了,剛才你也很認真地在聽兩位技術專家的探討,他們談到了前一段時間 OpenAI 事件背后有一些技術的關鍵因素,甚至提到了大模型需要慢思考的能力,不知道你有什么看法?

          王小川:是的,今年籌備大模型到 4 月份成立公司,我提了幾個關鍵詞,一個叫搜索增強,因為要把傳統知識接進去,第二個我希望是大模型做強化學習,當時提這個點,是因為已經看到了大模型本身代表了一種快思考的方式,像人一樣,一拍腦袋我就給你答案,張口就能說,它這種學習和應用推理的方法是有自己的不足的,以大模型為原點肯定不夠,當時我們認為強化學習可以產生很大幫助,這在百川內部工作里面,也是一直非常關注的領域。

          張鵬:就是慢思考?

          王小川:對,就是慢思考,相對于慢思考,今天的大模型就是代表快思考。說兩點自己的見解吧:快思考它都不叫「思」,慢思考的話我認為它才有這樣更多「思」,OpenAI 大模型為代表,它叫「學」,它的知識來源是學過來的。

          我并不強調推理的「思」,其實人在學習的時候,你可能就要想半天,這叫思,所以之前話孔子有一句話「學而不思則罔、思而不學則殆?!?/p>

          具體投射下來,大模型就是學,它其實是不思的,它不像人一樣,會來回琢磨,會把想象空間打開來看,什么系統是在思?OpenAI 剛成立公司以及 DeepMind 做的事情,比如做 AlphaZero 和打游戲,這個事情是在思。

          但是那個是強化學習的設置上,叫多智能體的對抗,AlphaZero 它不是一個學習系統,它把之前 6000 萬局(棋譜訓練)的棋都扔掉了,反而是自己在對抗博弈,在博弈中找到一種新的理解,最后通了,它是這樣一個「思」。

          AlphaZero 思完之后它停在原地,就是「殆」,它只做特定的任務,無法把它拓展到其他的領域里面,因此我們說大模型代表了「學」,AlphaZero 代表了「思」,這兩個系統集在一塊就會很厲害。

          百川智能創始人、CEO 王小川和極客公園創始人兼總裁張鵬分析大模型的「學」與「思」|極客公園

          張鵬:所以接下來很重要的是要真正做到學而思是吧?學和思要合在一起。

          王小川:對。具體一點的話,我們想的「思」這個場景,是你問大模型圍棋怎么下,它其實是不會下的。但是你問一個圍棋輸了贏了能判定嗎?大模型根據它已有的知識,是能夠判定的。甚至你說寫一個代碼來判定這個圍棋的輸贏,大模型是可以把這個代碼寫出來的。

          你再讓它寫一個代碼,每走一步棋之后這個棋的狀態是怎么轉移的,也就是下棋的整個過程,它也能寫出來。

          所以我們想象一下,如果大模型足夠強,雖然不會直接下圍棋,但是它可以寫出下圍棋這樣一個狀態遷移(Transaction Function)的代碼,以及最后判定圍棋輸贏的代碼。也就是說有機會讓大模型自己寫出一個 AlphaGo 的代碼再運行它,運行完之后就可以下棋了,這件事情是有機會發生的。

          張鵬:歐美的技術還在不斷探索邊界,也讓人覺得有壓力,你覺得這個距離怎么丈量,能縮短嗎?自己能創造出不同的價值嗎?

          王小川:去美國之前,我在百川這么講的,叫「理想上慢半步,落地上快一步?!购髞硎侨チ嗣绹貋碇?,把理想折了半,變成「理想慢一步,落地上成快三步」。

          02 大模型應用,中國可能「搶跑」

          張鵬:怎么理解理想上慢一步、落地上快三步?

          王小川:和他們接觸之后,我認為雙方思考的底層是不一樣的,OpenAI 原生是一個非營利的組織,就是想探索 AGI 的邊界,而且他們真是這么做的。

          上一次跟他們聊,他們想嘗試把一千萬顆 GPU 連在一起,造出足夠大的系統。一千萬顆 GPU 什么概念?英偉達一年生產一百萬顆,GPT-4 大概是兩萬五千顆,我們今天對標的 GPT-3.5 才四千顆 GPU。他們在想問題的時候,出發點就跟我們不在一個世界里面,所以跟他們拼理想,在這一點上我們比不過。

          這種情況下,人和公司都要找到自己的定位,在這個土壤里,我們要有一個自信是,我們有機會在應用落地上走的更快。

          也許隨著我們用戶數據集變得更大,技術積累更雄厚之后,我們應用能做的足夠好,甚至還能拿到美國去用。這種情況下,不代表說一定到了 GPT-4、GPT-5、GPT-6 的階段,你才有機會去做應用。

          不同土壤長出不同的東西,做應用是中國傳統的一個強項,也是一個創新,我反而認為是公平了。這也是中國公司遇到的更好的機會,尤其是如今美國在 OpenAI 一家獨大的情況下,做應用的公司,得迎著 OpenAI 的技術做應用,它技術做成什么樣,你就做什么樣的應用。

          但是國內的模型公司,自己就能做應用,這種端到端的連貫性,是有機會在應用落地時,就在一個領域里,比美國的公司更快地跑出來。

          王小川認為中國大模型在應用上可能跑的更快|極客公園

          張鵬:我們有時候肯定很愿意去追求一個有理想和使命感的事,在 AGI 這個大進程里,我們可以加入這個團隊,他們可能是前鋒,在突破邊界,但是我們可能是個自由人或者后腰,但他在團隊里也有意義,比如說我能把技術落地下來,變成有價值的東西。

          王小川:這兩個層面都會有推導,鵬總剛才講的是,你作為一個世界公民,作為一個中國的公司,在世界上的一個分工合作,而不是分一個敵我,只剩一種競爭的關系,他們的發明我們尊重,我們追趕,但是我們也有自己獨有的貢獻。而不只是:我認為我需要自己,這世界并不需要我。

          03 大模型創業,技術產品匹配最重要

          張鵬:蠻好的,想的很通透,在這一波創業找到了一個跟自己和解的點,就是我們怎么在世界性的一個有意義的游戲里,成為一個玩家,未必每個人都要做前鋒。

          那也就說到另一個問題,今天大家都在說 Super App,都沒有看到什么是未來的 Super App,剛才李彥宏也說,今天還不能確定。但我覺得如果我們要做 Super App,需要什么樣的出發點?比如說以前我們講 PMF(產品市場匹配),今天這個 PMF 怎么做?

          王小川:對,這一點我在想可能拉近、拉遠兩個層面都有。拉遠的原因是,當我們設想重構原有的應用,比如把微信再重構一次,這個思考的角度可能一下子就把自己限制住了,所以第一,你得把這個視角拉遠。

          因此回到做 Super App,一個遠期方向是它代表人的根本的訴求,這種根本訴求,我把它總結成三個關鍵詞,人需要有三個東西:一個是自己有創造力、第二個是需要健康、第三個需要快樂。

          健康快樂大家特別容易理解,但是創造力呢,是源于人在世界里你總希望你的存在對世界有所不同,你能對世界有所改變,因此怎么能幫你去改變這個世界是一個可以獨立分出來的門類。

          當我們有這種愿景的時候,那健康怎么做、娛樂怎么做,以及怎么幫你得到信息,讓你變的更有創造力,遠期來看,這三個方向就有了。但是反過來,我們也會拋掉一些東西,比如說要做營銷文案撰寫,幫你做客服對話,其實大模型挺擅長做這些,但是我覺得這些沒有回到人的根本需求,這就又陷到原來的一種所謂重構的邏輯里了。

          因此有這樣三個大的方向感之后,我會有不同的想法,這就是一個拉開了的思考,否則也掉到了大廠競爭的坑里去了。

          第二,我們往近拉,我想提一個重要的詞,就是剛才提到「PMF」這個詞,我想用新的一個詞講,因為 PMF 老講產品和市場之間的關系,把一個詞丟掉了,就是「技術」。技術,在 AI 這個時代里,它依然有很多不完美和不確定性,不像以前做淘寶或微信的時候。

          我覺得現在技術是瓶頸,但其實技術問題是一定可以解決的,只是取決于工程師的水平、成本等等問題,你想要什么,在工程層面都能實現。但大模型技術,包括剛提到的幻覺、時效性,只會自然語言,這個技術本身就有局限性和不完美。

          所以我們離 AGI 還有距離,正因為技術的不完美,我們更要明確,一個技術適合于什么產品,而不是先去搶市場,在市場看了一圈回來就開始做,這種膽量我覺得是挺可貴,但是第一性原理「TP」技術和產品之間怎么協調,怎么做,我認為是現在要思考的事情。

          舉一個好的案例就是 Character.ai,Character.ai 創始人其實不是產品背景,他對技術,尤其產品背后的算法是非常地了解,他還洞見到這個技術本身是不完美的,可能會犯錯的,因此他首先想到拿它去做娛樂行業。其次,這個技術能夠首先承載的是自然的對話,它是一個人設,所以把它做成一個角色。

          張鵬:這樣它的缺點就成了特點?

          王小川:我先提兩個概念,一是,我們以前老是覺得自己在造工具,工具其實代表很多確定性,但是我們這一次造的不是工具,這一次我們造的是伙伴,更像人一樣的新物種。我們人類要接受它自己的缺點,它的優點。人是有幻覺的,人有幻覺我能用他,那為什么機器有幻覺就不能用呢?

          最后還是一個人應當匹配一件事,所以在技術的匹配上,我們認為得換一個視角,不用工具視角來看,而是面對一個人的視角來看,這是我的一個思路。

          張鵬:你剛剛說的是 Technology - Product - Fit(技術產品契合度),TPF,而不是 PMF 這個概念。

          王小川:對,對技術本身要有足夠的理解,讓技術匹配相關的事情,這個對產品經理是有要求的,或者公司一號位的產品經理要產生這樣的認知,大模型擅長什么,不擅長什么。這個過程是造人,而不是造工具。

          以前有一個講國王與畫師的故事,國王瞎了一只眼睛,缺了一條腿,但是他很自戀,要畫自畫像,他就把全國的畫師拉過來畫,畫一個殺一個,因為畫得太像了,缺個眼睛,缺一條腿,那就是詆毀形象。但是畫師把眼睛畫得目光炯炯,又英姿颯爽的形象,那就是欺君,一樣殺掉,這問題就沒解了。后來有一個畫師畫了國王打獵的圖,站在一個大石頭上,蜷著一條腿被掩蓋了,國王在拉弓,缺的眼正好是閉上的,這么畫就兼顧了。

          技術擅長什么,不擅長什么,怎么去做匹配,這對產品經理就有更大的要求,我把它叫做 TPF。

          張鵬:TPF 這個詞我覺得很好。TPF 看起來才是起點,如果站在未來,我們要做 Super App,如何能做好 TPF 呢?什么情況下叫做好了 TPF?

          王小川:以前產品經理更多是寫一個文檔,描述對功能定義和要求,可以畫結構設計圖給老板看,這個產品長這樣,滿足用戶什么需求,精確做到每一步的功能。

          今天大模型不是這樣的做法,每次給大模型輸入的時候,它的輸出是不確定的,不是用一個詞一句話能講完的。這時候很難用一套演繹規則講清楚這件事。邏輯是在做演繹,一定要把它拆解開,變成一堆評測集,產品經理的要求不只是定義這個產品,而是要把定義的產品轉化成后面的評測集。也就是說,要對模型在某種輸入下的輸出,做什么樣的測試集合。

          這時,技術對口的也不是工程人員,而是算法人員。算法之前的工作習慣是你給我評測集,我去優化我的算法來滿足評測集。不管是通過調 prompt 的方法、還是做 SFT,還是 Post-Train 的方法。這種情況就變成了產品經理定義評測集,技術拿到評測集之后,再去尋找數據集或者訓練集去訓練這個系統,滿足這個評測集。

          王小川講解如何給大模型定 OKR|極客公園

          張鵬:這就是給大模型定 OKR。

          王小川:它有一套非常嚴謹的數學評價方法。只要干過算法的工程師都會適應這樣的方法,最后用評測集和數據說話,在我們內部,這變成了一種標準的工作方法。

          包括搜索公司也是這種方法,搜索是算法驅動型的產品,用評測集驅動的方式,只是我們之前由于在互聯網發展到高級階段的時候,技術不是問題,甚至已經不是算法驅動,是工程驅動的時候,這個 PMF 不是不對,只是缺了一層 TPF,最后會發現產品出來不是不能滿足市場需求,而是一直在迭代,做不出階段性的產品。

          張鵬你剛剛某種程度解釋了我很關心的一個問題——什么是 AI-native 的開發。本質上,是看我們在開發什么,你要在設定的目標下設定評測集,讓數據集能有效訓練出滿足評測集的要求,這個是你真正的開發引擎。

          王小川:這是叫 AI-Native。如果 AGI-Native 的話,就是把 AI 的模型能力范式更加深入。

          04 好的大模型應用,要讓用戶「用得爽」

          張鵬:這確實會對產品經理提出全新的要求。以前說 PMF 做得很不錯,我們是有感知的,比如用戶的使用量增長,用戶體驗很好。但現在怎么評價做好了 TPF?

          王小川:TPF 首先對產品經理有要求。

          第一,一定能把需求轉化成測試集,測試集能讓技術工程師在滿足需求時發現「手感」在進步。以及把 Demo 往外推出的時候,用戶提的需求分布正好和產品經理提的評測集分布一致,評測集里面的結果能滿足用戶需求。

          第二,推產品的時候會提到 PMF,看市面上的 Marketing Fit(市場契合度)分布是否一致,用戶是否滿意。

          張鵬:如果用戶能把你開發的產品用得很好,是應該用得好,還是用得爽?用得爽是用戶量爆發了,變成一個 Super App;用得好是一步步來。我們是要追求一下做爆?還是一層一層先解決少數人問題,再解決多數人問題?

          王小川:這個不矛盾。首先「好」是跟原來對比的,你可以自己跟自己比好了多少。如果和已經成熟的大廠對比,好 30%、20% 就是巨大的收益。但對于創業公司,如果是 AI-Native 原生應用的話,一開始就要用得爽,至少對一類有特點的具體的需求,用戶得覺得有十倍好的感知。

          張鵬:爽就是十倍好。

          王小川:不是好一點,是得讓你有驚喜感。今天大模型選有亮點的來做,必須做到十倍的體驗提升,周邊的需求得做到五倍、三倍的提升,這樣才能把波峰拔得足夠高后再逐步拓寬。我認為這個產品如果一開始不讓你爽,只是比原來好一些,是不夠用的。

          張鵬:今天在場內很多人也很關心如何參與到大模型推動的這個新時代。如果要做新范式下的產品經理。他們應該怎么出發?

          王小川:看公司屬性,一種公司是要做端到端,本身既要做應用,也要做模型。一種是更注重應用的公司,它不怎么碰模型或者用小模型解決。兩類公司路徑上不同,但有件事情一定要先做到,就是「用」,把自己當成大模型時代里一個狂熱的粉絲,去體驗和感受這個模型給你帶來的不同之處,讓你去好奇它,感受它,欣賞它。今天要把這個模型用起來,就像朋友一樣,你能感受什么地方行,什么地方不行。

          張鵬:得先成為一個大模型的超級用戶。

          王小川:我相信極客公園的粉絲們天生有這樣的動力,有這樣的好奇心。用起來之后,你的靈感就會冒出來,就會知道什么是它擅長做的事,由此再變成你后面產品的構思。

          張鵬:大模型技術還在漲潮的過程中,得先跟著它一起往上漲,離它近一點才能考慮怎么應用它。

          公司不斷在發展,你肯定也在不斷招人。你去選產品經理的時候,會關注他什么樣的氣質,什么樣的經驗,能不能開源一下你選人的標準?

          王小川:百川計劃明年發超級應用,我們不談經驗,只能談一些想象。

          我們蠻希望找到之前有經驗的人,做產品的人你沒有之前的經驗和想法,就說我想創業,這種情況下創業難度蠻高的。我們會要求你能夠把產品完整且有畫面感地拋出來。能夠設想出大模型長什么樣,你也有充分的推動力、好奇心、想象力。

          王小川詳解 AI 時代產品經理的「既要又要」|極客公園

          同時我們也希望你之前有做傳統產品的經驗。也就是希望既有之前的成功經驗,但是又能夠把自己的經驗打散掉去滋養大模型,還能構想出大模型新的樣子,現在這個階段,是「既要又要」。

          今天中國和美國的環境不一樣,包括百川和國內公司都是爭分奪秒的狀態,沒法給你三年、五年的時間做探索。

          05 享受大模型創業的「推背感」

          張鵬:某個在相關領域有經驗,但沒有技術能力,他能不能自己獨立做大模型應用的探索?舉個例子,你在健康領域里在做努力,我在健康領域里面有多年積累的,也具備你說的氣質。我是加入你的公司?還是自己也可以在接入別人的模型后做探索?

          王小川:兩個道路大家都會做,會有人自己探索,但探索過程中很有可能走著走著發現走不動了,有一種無力感,最后還是需要模型的支持。

          因此在當下中國,還是加入一家模型公司機會更大,因為現在還沒到能夠獨開去做應用的程度。網上有文章說自己調模型做應用,這個時代還沒有到來。未來兩年之內,還是加入一家公司,能夠提供平臺級支持,幫助你把原有經驗打散掉融進來,這樣成功概率會大很多,有可能做成超級應用。做小應用無礙,但做大的事情,還是盡量和模型公司充分互動。

          張鵬:聽起來還是希望我加入百川。

          王小川:主要看你希望做大還是做小。

          張鵬:做大的就得去百川。

          王小川:是。

          張鵬:4 月份的時候,每個人恨不得晚上不睡覺,現在大模型跑了 8 個月,一開始的興奮也差不多消退了。創業維艱,在沉淀一段時間以后,你這次創業的心態怎么樣?

          王小川:這 8 個月的時間團隊跑得很快,成長也很迅速?,F在到了更多沉淀大模型方法論的時期,雖然我們覺得自己之前的技術、能力、產品、關注、經驗都足夠,但做起來的時候依然覺得不夠「輕巧」。

          在共同探索大模型的方法過程中,如何找出模型和應用之間最有效聯動的狀態,我們的認知也在不斷提高。我認為好的狀態是:看到一個月前的自己是個傻子,那你就又進步了。

          剛開始工作早幾年的時候,是以每周的速度迭代,會發現自己的想法還不夠多,這次(大模型創業)我們又回到以月為單位,沒到那么敏捷一個狀態。在一個月之后看到自己之前的不足,在快速迭代中。為了參與到大模型時代,我們的管理層和產品經理都是戰戰兢兢,如履薄冰地不斷調整自己原有的工作方法。

          張鵬:這是讓你很享受的狀態。

          王小川:對,每天都在刺激進步,自己還有多維地成長,哪怕想法能領先半步,但有時候發現,自己走著走著有更好的想法出來。

          張鵬:挺理解這個狀態。再過五年,這家公司是什么樣子會讓你覺得比較滿足?公司的目標是什么?

          王小川:在幫助人創造、健康、快樂這三個方向,我們都有超級應用的探索。我希望是一到五年,五年真的不敢想,因為五年之后,技術發展的高度可能都不是我們現在能理解的,每天我們技術人員都感嘆有新的論文和發展出現,有強烈的「推背感」。

          我希望在兩年時間里,我們證明了大模型是能夠做超級應用的,在健康、娛樂、幫助人創造上,它能夠像互聯網時代一樣,給人帶來巨大的幫助或者希望,人們都能夠體驗到或者用到,我有這樣的信念。

          到五年時間,我們可能有全新的玩法,可能五年以后地上機器人在跑,大家戴著 VR 眼鏡,每個人的數字分身都出來了。五年的時間太長,能夠想到兩年的畫面,我就很滿足了。

          最新文章

          極客公園

          用極客視角,追蹤你不可錯過的科技圈.

          極客之選

          新鮮、有趣的硬件產品,第一時間為你呈現。

          張鵬科技商業觀察

          聊科技,談商業。

          国产精品久久久久一区二区三区,美女禁区a级全片免费观看,一个人看的www视频免费下载,亚洲精品国产精品乱码不99

          1. <ruby id="2nt17"><table id="2nt17"></table></ruby><listing id="2nt17"><thead id="2nt17"></thead></listing>
            <ruby id="2nt17"><table id="2nt17"></table></ruby>
            <strong id="2nt17"></strong>
            <li id="2nt17"></li>