# AI行業發展歷程與Crypto結合探索人工智能行業近期的發展被視爲第四次工業革命,大模型的出現顯著提升了各行各業的效率。深度學習技術爲AI行業帶來了新一輪繁榮,這股風潮也影響到了加密貨幣行業。本文將詳細探討AI行業的發展歷史、技術分類,以及深度學習技術對行業的影響。深入剖析深度學習中GPU、雲計算、數據源、邊緣設備等產業鏈上下遊的發展現狀與趨勢。同時從本質上探討Crypto與AI行業的關係,對Crypto相關的AI產業鏈格局進行梳理。## AI行業的發展歷史AI行業從20世紀50年代起步,爲實現人工智能的願景,學術界和工業界在不同時代不同學科背景下,發展出了多種實現人工智能的流派。現代人工智能技術主要使用"機器學習"這一術語,該技術理念是讓機器依靠數據在任務中反復迭代以改善系統性能。主要步驟是將數據送到算法中,使用此數據訓練模型,測試部署模型,使用模型完成自動化預測任務。機器學習有三大主要流派,分別是聯結主義、符號主義和行爲主義,分別模仿人類的神經系統、思維、行爲。目前以神經網路爲代表的聯結主義佔據上風(也稱爲深度學習)。神經網路架構有一個輸入層一個輸出層,但有多個隱藏層,一旦層數以及神經元(參數)的數量變得足夠多,就有足夠的機會擬合復雜的通用型任務。基於神經網路的深度學習技術,也有多個技術迭代與演進,從最早期的神經網路,到前饋神經網路、RNN、CNN、GAN,最後演進到現代大模型如GPT等使用的Transformer技術。Transformer技術只是神經網路的一個演進方向,多加了一個轉換器,用於把所有模態的數據編碼成對應的數值來表示。然後再輸入到神經網路中,這樣神經網路就能擬合任何類型的數據,實現多模態。AI發展經歷了三次技術浪潮:1. 20世紀60年代,符號主義技術發展引起的第一次浪潮,解決了通用的自然語言處理以及人機對話問題。2. 1997年,IBM深藍戰勝國際象棋冠軍卡斯帕羅夫,標志着第二次發展高潮。3. 2006年起,深度學習技術的發展引發第三次技術浪潮,這也是聯結主義的鼎盛時期。近年來,深度學習技術不斷突破,出現了多個標志性事件:- 2015年,OpenAI創建。- 2016年,AlphaGo戰勝世界圍棋冠軍李世石。 - 2017年,Google提出Transformer算法。- 2018年,OpenAI發布GPT模型。- 2020年,OpenAI發布GPT-3。- 2023年1月,基於GPT-4的ChatGPT推出。## 深度學習產業鏈當前大模型語言使用的都是基於神經網路的深度學習方法。以GPT爲首的大模型造就了一波人工智能熱潮,大量玩家湧入這個賽道。市場對於數據、算力的需求大量迸發。在進行基於Transformer技術的GPT等大模型訓練時,一共分爲三個步驟:1. 預訓練:通過大量數據對尋找模型各神經元最佳參數,最耗費算力。2. 微調:使用少量高質量數據訓練,提升模型輸出質量。3. 強化學習:建立獎勵模型,對大模型輸出進行評估,迭代參數。影響大模型表現主要由參數數量、數據量與質量、算力三個方面決定。這三個要素孵化了一整條產業鏈。### 硬件GPU提供商GPU是目前進行訓練和推理的主要芯片。Nvidia處於絕對領先地位,其H100、A100等芯片被廣泛用於大模型商業化落地。2023年,Nvidia最新的H100芯片供不應求,出貨週期達到52周。許多大型科技公司都大量購買H100芯片組建高性能計算中心。### 雲服務提供商雲服務提供商在購買足夠的GPU組建HPC後,能爲資金有限的人工智能企業提供彈性算力以及托管訓練解決方案。目前市場主要分爲三類雲算力提供商:1. 傳統雲廠商爲代表的超大規模雲算力平台(AWS、Google、Azure)。2. 垂直AI賽道的專業雲算力平台,如CoreWeave、Lambda等。3. 推理即服務提供商,如Together.ai、Fireworks.ai等。### 數據庫提供商對於AI數據以及深度學習訓練推理任務,目前業內使用的是"矢量數據庫"。矢量數據庫旨在高效地存儲、管理和索引海量高維矢量數據。目前主要玩家有Chroma、Zilliz、Pinecone、Weaviate等。伴隨着數據量需求增加,以及各種細分領域大模型和應用的迸發,對矢量數據庫的需求將大幅增加。### 邊緣設備在組建GPU高性能計算集羣時,通常會消耗大量能量,產生大量熱能。這就需要一些降溫的邊緣設備來保證HPC持續運行。涉及能源供應和冷卻系統兩個方向。目前在能源供給側主要採用電能。在HPC集羣散熱方面,目前以風冷爲主,但許多VC正在大力投資液冷系統。液冷主要分爲冷版式液冷、浸沒式液冷、噴淋式液冷三個探索方向。### 應用目前AI應用的發展,類似於區塊鏈行業,基礎設施非常擁擠,但應用開發卻沒有跟上。前十月活的AI應用大多是搜索類型,應用類型較爲單一。同時AI應用的用戶留存率遠低於傳統互聯網應用。根據紅杉美國的報告,AI應用從面向的角色角度分爲三類:面向專業消費者、企業、普通消費者。面向消費者主要用於提升生產力,面向企業則用於Marketing、法律、醫療設計等行業。## Crypto x AI的關係區塊鏈得益於ZK技術的發展,演變成了去中心化 + 去信任化的思想。區塊鏈網路本質上是一個價值網路,每一筆交易都是以底層代幣爲基礎的價值轉換。Tokenomics是具體的Token價值體現規則。代幣經濟學能夠規定生態系統結算物(網路原生代幣)的相對價值,雖然無法爲每一個維度進行定價,但代幣價格體現了多維度價值。一旦爲網路賦予代幣並流通,就能把功能或思想賦予價值。代幣和區塊鏈技術這種對價值重新定義與發現的手段,對AI行業也至關重要。在AI行業發行代幣能讓各方面進行價值重塑,激勵更多人在各細分賽道深耕。區塊鏈技術的不可篡改和無需信任特性也能實現一些需要信任的AI應用。總之,代幣經濟學能促進價值重塑和發現,去中心化帳本能解決信任問題,將價值在全球範圍重新流動。Crypto與AI的結合有其實際效用,能重塑價值視角,解決信任問題,發現剩餘價值。
AI與Crypto相融合 重塑產業價值鏈
AI行業發展歷程與Crypto結合探索
人工智能行業近期的發展被視爲第四次工業革命,大模型的出現顯著提升了各行各業的效率。深度學習技術爲AI行業帶來了新一輪繁榮,這股風潮也影響到了加密貨幣行業。
本文將詳細探討AI行業的發展歷史、技術分類,以及深度學習技術對行業的影響。深入剖析深度學習中GPU、雲計算、數據源、邊緣設備等產業鏈上下遊的發展現狀與趨勢。同時從本質上探討Crypto與AI行業的關係,對Crypto相關的AI產業鏈格局進行梳理。
AI行業的發展歷史
AI行業從20世紀50年代起步,爲實現人工智能的願景,學術界和工業界在不同時代不同學科背景下,發展出了多種實現人工智能的流派。
現代人工智能技術主要使用"機器學習"這一術語,該技術理念是讓機器依靠數據在任務中反復迭代以改善系統性能。主要步驟是將數據送到算法中,使用此數據訓練模型,測試部署模型,使用模型完成自動化預測任務。
機器學習有三大主要流派,分別是聯結主義、符號主義和行爲主義,分別模仿人類的神經系統、思維、行爲。目前以神經網路爲代表的聯結主義佔據上風(也稱爲深度學習)。神經網路架構有一個輸入層一個輸出層,但有多個隱藏層,一旦層數以及神經元(參數)的數量變得足夠多,就有足夠的機會擬合復雜的通用型任務。
基於神經網路的深度學習技術,也有多個技術迭代與演進,從最早期的神經網路,到前饋神經網路、RNN、CNN、GAN,最後演進到現代大模型如GPT等使用的Transformer技術。Transformer技術只是神經網路的一個演進方向,多加了一個轉換器,用於把所有模態的數據編碼成對應的數值來表示。然後再輸入到神經網路中,這樣神經網路就能擬合任何類型的數據,實現多模態。
AI發展經歷了三次技術浪潮:
20世紀60年代,符號主義技術發展引起的第一次浪潮,解決了通用的自然語言處理以及人機對話問題。
1997年,IBM深藍戰勝國際象棋冠軍卡斯帕羅夫,標志着第二次發展高潮。
2006年起,深度學習技術的發展引發第三次技術浪潮,這也是聯結主義的鼎盛時期。
近年來,深度學習技術不斷突破,出現了多個標志性事件:
深度學習產業鏈
當前大模型語言使用的都是基於神經網路的深度學習方法。以GPT爲首的大模型造就了一波人工智能熱潮,大量玩家湧入這個賽道。市場對於數據、算力的需求大量迸發。
在進行基於Transformer技術的GPT等大模型訓練時,一共分爲三個步驟:
預訓練:通過大量數據對尋找模型各神經元最佳參數,最耗費算力。
微調:使用少量高質量數據訓練,提升模型輸出質量。
強化學習:建立獎勵模型,對大模型輸出進行評估,迭代參數。
影響大模型表現主要由參數數量、數據量與質量、算力三個方面決定。這三個要素孵化了一整條產業鏈。
硬件GPU提供商
GPU是目前進行訓練和推理的主要芯片。Nvidia處於絕對領先地位,其H100、A100等芯片被廣泛用於大模型商業化落地。
2023年,Nvidia最新的H100芯片供不應求,出貨週期達到52周。許多大型科技公司都大量購買H100芯片組建高性能計算中心。
雲服務提供商
雲服務提供商在購買足夠的GPU組建HPC後,能爲資金有限的人工智能企業提供彈性算力以及托管訓練解決方案。目前市場主要分爲三類雲算力提供商:
傳統雲廠商爲代表的超大規模雲算力平台(AWS、Google、Azure)。
垂直AI賽道的專業雲算力平台,如CoreWeave、Lambda等。
推理即服務提供商,如Together.ai、Fireworks.ai等。
數據庫提供商
對於AI數據以及深度學習訓練推理任務,目前業內使用的是"矢量數據庫"。矢量數據庫旨在高效地存儲、管理和索引海量高維矢量數據。
目前主要玩家有Chroma、Zilliz、Pinecone、Weaviate等。伴隨着數據量需求增加,以及各種細分領域大模型和應用的迸發,對矢量數據庫的需求將大幅增加。
邊緣設備
在組建GPU高性能計算集羣時,通常會消耗大量能量,產生大量熱能。這就需要一些降溫的邊緣設備來保證HPC持續運行。涉及能源供應和冷卻系統兩個方向。
目前在能源供給側主要採用電能。在HPC集羣散熱方面,目前以風冷爲主,但許多VC正在大力投資液冷系統。液冷主要分爲冷版式液冷、浸沒式液冷、噴淋式液冷三個探索方向。
應用
目前AI應用的發展,類似於區塊鏈行業,基礎設施非常擁擠,但應用開發卻沒有跟上。前十月活的AI應用大多是搜索類型,應用類型較爲單一。同時AI應用的用戶留存率遠低於傳統互聯網應用。
根據紅杉美國的報告,AI應用從面向的角色角度分爲三類:面向專業消費者、企業、普通消費者。面向消費者主要用於提升生產力,面向企業則用於Marketing、法律、醫療設計等行業。
Crypto x AI的關係
區塊鏈得益於ZK技術的發展,演變成了去中心化 + 去信任化的思想。區塊鏈網路本質上是一個價值網路,每一筆交易都是以底層代幣爲基礎的價值轉換。Tokenomics是具體的Token價值體現規則。
代幣經濟學能夠規定生態系統結算物(網路原生代幣)的相對價值,雖然無法爲每一個維度進行定價,但代幣價格體現了多維度價值。一旦爲網路賦予代幣並流通,就能把功能或思想賦予價值。
代幣和區塊鏈技術這種對價值重新定義與發現的手段,對AI行業也至關重要。在AI行業發行代幣能讓各方面進行價值重塑,激勵更多人在各細分賽道深耕。區塊鏈技術的不可篡改和無需信任特性也能實現一些需要信任的AI應用。
總之,代幣經濟學能促進價值重塑和發現,去中心化帳本能解決信任問題,將價值在全球範圍重新流動。Crypto與AI的結合有其實際效用,能重塑價值視角,解決信任問題,發現剩餘價值。