படம் AI-உருவாக்கப்பட்டது
செயற்கை நுண்ணறிவின் போர்க்களம் "கிளவுட் கம்ப்யூட்டிங் சக்தி ஏகபோகத்திலிருந்து" "முனைய நுண்ணறிவு விழிப்புணர்வுக்கு" மாறுகிறது, இது ஒரு உலகளாவிய போட்டியாகும், இதில் அதிகமான மக்கள் பங்கேற்கலாம் மற்றும் அதிக மாறிகள் உள்ளன.
கடந்த சில மாதங்களில், பெரிய மாடல் தொழில்துறையின் கருத்து விரைவாக புதுப்பிக்கப்பட்டுள்ளது, மேலும் டீப்சீக்கிற்கு முன்பு, முனைய சாதனங்கள் மின் நுகர்வு, வெப்பச் சிதறல் மற்றும் சேமிப்பக இடம் ஆகியவற்றால் மட்டுப்படுத்தப்பட்டன, மேலும் இலகுரக மாதிரிகளை மட்டுமே இயக்க முடியும், மேலும் விளைவு மற்றும் அனுபவம் நன்றாக இல்லை. டீப்சீக் "சிறிய அளவுருக்கள் மற்றும் பெரிய நுண்ணறிவு" தொழில்நுட்ப பாதை மூலம் பல்லாயிரக்கணக்கான மாதிரிகளை டெர்மினல் சில்லுகளாக சுருக்கும்போது, சாதன பக்க AI இன் அடிப்படை தர்க்கம் தரமான மாற்றங்களுக்கு உட்பட்டுள்ளது என்பதை முழு தொழிற்துறையும் உணரத் தொடங்குகிறது.
从资本市场上相关概念股业绩表现和走势也可窥见一斑。端侧AI概念龙头移远通信、美格智能业绩表现亮眼,广和通市场关注度同步提升。其中,移远通信预计2025年一季度归母净利润2亿元,同比增长265.19%,主要受益于物联网需求复苏及车载、AIoT场景的拓展,边缘计算模组及大模型技术加速落地。美格智能预计一季度净利润范围取中值为4600万元,同比增长611%,高算力AI模组在智能汽车、无人机等领域出货量激增,海外业务占比提升至32%。广和通虽未明确披露一季度净利润,但其股价区间涨幅达25.11%,显示市场对其5G模组及车载业务前景的乐观预期。
从云端算力来看,头部大模型厂商的门槛是万卡集群,甚至十万卡集群也在规划,大模型开始趋于集中,但这部分头部厂商的预训练需求不会缩减,反而会增加。与此同时,更多AI公司正在投入后训练、推理算力的布局,产业逐渐达成共识,未来AI算力特别是推理算力会出现千倍的增长,网络带宽会出现百倍增长,存储需求也会出现千倍增长。
2025年或是端侧AI的爆发元年,算力行业加速竞逐推理算力。
"எண்ட்-சைட் AI தற்போது சிறந்த சகாப்தத்தில் உள்ளது" என்று Aishu Intelligence இன் CEO Sun Yukun கூறினார், பெரிய மாடல்களின் திறந்த மூலமானது இறுதி-பக்க மற்றும் எட்ஜ் AI இன் வளர்ச்சிக்கு பெரும் வளர்ச்சி வாய்ப்புகளைக் கொண்டு வந்துள்ளது என்று நாங்கள் நம்புகிறோம். இறுதி-பக்க சில்லுகளின் வளர்ச்சியின் கண்ணோட்டத்தில், கணினி சக்தி மற்றும் நினைவக அலைவரிசை இரண்டும் புதுமைப்படுத்தப்பட்டு மேம்படுத்தப்பட்டுள்ளன, மாதிரி திறன்களின் கண்ணோட்டத்தில், இறுதி-பக்க செயல்பாட்டிற்கு ஏற்ற மாதிரி திறன்கள் பாய்ச்சல் மற்றும் எல்லைகளால் மேம்பட்டுள்ளன, மேலும் சாதன பக்க நுண்ணறிவு சிறப்பாகவும் சிறப்பாகவும் இருக்கும்.
டீப்சீக்கின் மாதிரி மறு செய்கைகள் (எ.கா., V1 முதல் V0 வரை) இன்னும் அளவிடுதல் சட்டத்தைப் பின்பற்றுகின்றன, இது அளவுரு அளவை அதிகரிப்பதன் மூலம் செயல்திறனை மேம்படுத்துகிறது (எ.கா., நூற்றுக்கணக்கான பில்லியன்களிலிருந்து டிரில்லியன்கள் வரை) மற்றும் பயிற்சி தரவுகளின் அளவு. GPT தொடர் மாடல்களில் அளவுருக்களின் வெடிக்கும் வளர்ச்சி போன்ற ஆரம்பகால AI வளர்ச்சியில் இந்த பாதை பரவலாக இருந்தது. இருப்பினும், மாதிரியின் அளவு இயற்பியல் வரம்பை நெருங்கும்போது (கணினி சக்தி மற்றும் தரவு கையகப்படுத்தலின் இடையூறு போன்றவை), அளவுரு விரிவாக்கத்தை மட்டுமே நம்பியிருப்பதன் விளிம்புநிலை வருவாய் குறைகிறது, மேலும் தொழில்நுட்ப கவனம் படிப்படியாக அனுமான தேர்வுமுறை மற்றும் மல்டிமோடல் பயன்பாடுகளுக்கு மாறுகிறது, இது மாதிரி வடிகட்டுதல் மூலம் அனுமான செலவைக் குறைக்க டீப்சீக்-ஆர் 0 ஆல் வகைப்படுத்தப்படுகிறது.
DeepSeek ஆல் தொடங்கப்பட்ட NativeSparseAttention (NSA) பொறிமுறையானது, சிதறிய கவனம் பொறிமுறை மற்றும் வன்பொருள் தழுவல் திறன்களை மேம்படுத்துவதன் மூலம் நீண்ட சூழல் பணிகளின் பயிற்சி மற்றும் அனுமான வேகத்தை கணிசமாக மேம்படுத்துகிறது. முழு கவனம் மாதிரியின் அதே செயல்திறனைப் பராமரிக்கும் அடிப்படையில், NSA முன் பயிற்சிச் செலவைக் குறைக்கிறது மற்றும் அறிவுறுத்தல் அனுமானப் பணியில் சிறப்பாக செயல்படுகிறது. இந்த தொழில்நுட்ப முன்னேற்றம் சிக்கலான பணிகளின் இறுதி முதல் இறுதி வரை வரிசைப்படுத்துவதற்கான சாத்தியத்தைத் திறக்கிறது.
அலிபாபா கிளவுட் நுண்ணறிவு குழுவின் மூத்த துணைத் தலைவரும், பொது கிளவுட் வணிகப் பிரிவின் தலைவருமான லியு வெய்குவாங், புதிய மாதிரிகளை உருவாக்க அலிபாபா கிளவுட்டின் இரண்டு மிக முக்கியமான திசைகள் பகுத்தறிவு மற்றும் பகுத்தறிவு, மற்றொன்று முழு-மாதிரி ஒருங்கிணைப்பு என்று கூறினார். பகுத்தறிவைப் பொறுத்தவரை, பெரிய மாதிரிகள் எதிர்காலத்தில் வலுவான மற்றும் வலுவான பகுத்தறிவு திறன்களுக்கு உருவாகும், மேலும் வலுவூட்டல் கற்றல் சிந்தனைச் சங்கிலியின் திறனை மேம்படுத்தும்.
"குறிப்பாக, நாங்கள் வலுவூட்டல் கற்றலை வலியுறுத்த வேண்டும், 2025 ஆண்டுகளில் ஒரு புதிய முக்கியமான போக்கை நாங்கள் கண்டோம், பல வாடிக்கையாளர்கள் வலுவூட்டல் கற்றல் அடிப்படையிலான பிந்தைய பயிற்சி செய்ய மிகவும் சக்திவாய்ந்த அடிப்படை பெரிய மாதிரிகளைப் பயன்படுத்துகின்றனர், மேலும் வலுவூட்டல் கற்றல் பிந்தைய பயிற்சி இதையொட்டி அனுமானத்திற்கான ஒரு முக்கியமான திறன் நிரப்பியை வழங்குகிறது, எதிர்காலத்தில், அதிகமான வாடிக்கையாளர்கள் வலுவூட்டல் கற்றலின் அடிப்படையில் பிந்தைய பயிற்சியைச் செய்வார்கள் என்று நான் நம்புகிறேன், மேலும் புதிய மற்றும் மதிப்புமிக்க AI சொந்த பயன்பாடுகள் மற்றும் AI முகவர்களை மிகவும் சக்திவாய்ந்த அடிப்படை மாதிரிகளின் அடிப்படையில் உருவாக்கும். " இவ்வாறு அவர் கூறினார்.
டீப்சீக் கம்ப்யூட்டிங் மின் தொழில் சங்கிலியில் ஒரு எதிர்வினையைத் தூண்டுகிறது என்று சுகோன் டைட்டானியம் மீடியா பயன்பாட்டிடம் கூறினார், இது பிந்தைய மாதிரி பயிற்சி மற்றும் அனுமானத்தில் கணினி சக்திக்கான தேவையை பெரிதும் தூண்டுவது மட்டுமல்லாமல், AI கம்ப்யூட்டிங் சக்தி கட்டமைப்பின் மாற்றத்தை துரிதப்படுத்துகிறது, ஆனால் சந்தையின் பாதையை உடைக்க உதவுகிறது உயர்-கம்ப்யூட்டிங் GPUகள் மீதான சார்பு, உள்நாட்டு GPU முடுக்கம் அட்டைகளுக்கு முக்கிய வாய்ப்புகளைக் கொண்டுவருகிறது.
இது கிளவுட் அடிப்படையிலான அறிவார்ந்த கம்ப்யூட்டிங் மையமாக இருந்தாலும் அல்லது சாதனத்திற்கான பெரிய மாடல் ஆல் இன் ஒன் இயந்திரமாக இருந்தாலும், GPU முடுக்கி அட்டைகளுக்கான மென்பொருள் மற்றும் வன்பொருள் கூட்டு வடிவமைப்பு தேர்வுமுறையை மேற்கொள்ளவும், சில்லுகள், வழிமுறைகள் மற்றும் மாதிரிகளின் ஆழமான இணைப்பை உணரவும் AI உள்கட்டமைப்புக்கு இது ஒரு முக்கியமான கண்டுபிடிப்பு திசையாக மாறியுள்ளது.
"இந்த ஆண்டு ஏற்கனவே AI பெரிய மாடல்களின் வணிக பயன்பாட்டின் முதல் ஆண்டாகும்." ஜிங்குவா தகவல் தொழில்நுட்ப நிறுவனம், லிமிடெட் துணைத் தலைவர் லி சிவெய் கூறுகையில், "கடந்த ஆண்டு, நாங்கள் மிகவும் சிக்கிக்கொண்டோம், தொழில்துறையில் ஒரு 'சாத்தியமில்லாத முக்கோணம்' இருந்தது. சிறந்த உளவுத்துறைக்கு நாம் பெரிய மாதிரிகளைப் பயன்படுத்த விரும்பினால், வரிசைப்படுத்தல் மற்றும் பயிற்சிக்கு ஒப்பீட்டளவில் பெரிய செலவை நாம் செலுத்த வேண்டும், ஆனால் மத்திய அரசுக்கு சொந்தமான நிறுவனங்கள் போன்ற வாடிக்கையாளர்கள் பாதுகாப்பு பிரச்சினைகளுக்கு முன்னுரிமை அளிக்கிறார்கள், மேலும் நாம் பாதுகாப்பாக இருக்க விரும்பினால், நாம் தனியார்மயமாக்கப்பட்ட வரிசைப்படுத்தலை வரிசைப்படுத்த வேண்டும், மற்றும் தனியார்மயமாக்கப்பட்ட வரிசைப்படுத்தலின் செலவு தாங்க முடியாதது, மற்றும் சிறிய அளவுருக்கள் கொண்ட மாதிரிகளை வரிசைப்படுத்துவது சற்று கோழி. முதல் இரண்டு ஆண்டுகளில், எங்கள் வாடிக்கையாளர்களுக்காக நாங்கள் செய்த AI திட்டங்களில் இந்த சிக்கலை எதிர்கொண்டோம், அவற்றில் பல இப்போது வரை தாமதமாகியுள்ளன. ”
டீப்சீக் பி-சைட் அல்லது ஜி-சைடில் உள்ள அரசாங்கம் மற்றும் நிறுவனங்களால் வரவேற்கப்படுவதற்கான காரணம், இது "சாத்தியமில்லாத முக்கோணம்" என்ற சிக்கலை தீர்க்கிறது, ஆனால் பாதுகாப்பு சிக்கல்கள், உள்ளூர்மயமாக்கல் தொழில்நுட்ப வழிகள் போன்ற டீப்சீக்கைப் பயன்படுத்துவதற்கு இன்னும் பல வாசல்கள் உள்ளன, இது எளிய வரிசைப்படுத்தல் மூலம் ஒரே நேரத்தில் தீர்க்கக்கூடிய பிரச்சினை அல்ல.
உள்கட்டமைப்பின் நிலைத்தன்மை மற்றும் செயல்திறன் சாதன பக்க AI சுற்றுச்சூழல் அமைப்பின் வளர்ச்சிக்கு அடித்தளமாகும். பெரிய மாதிரிகள் இன்னும் தொழில்துறை வளர்ச்சியின் ஆரம்ப கட்டத்தில் உள்ளன, மேலும் தொழில்நுட்பத்தின் பரிணாமம் மேல் மற்றும் கீழ் செல்வாக்கு மற்றும் மாற்று மறு செய்கையின் போக்கைக் காட்டுகிறது, மேலும் AI பயன்பாடுகளின் வெடிப்பு மாதிரி செயல்திறன், மாதிரியின் கீழ் உள்கட்டமைப்பு மற்றும் AI பயன்பாட்டு மேம்பாட்டு கருவிகளுக்கான மிக உயர்ந்த தேவைகளை முன்வைத்துள்ளது, இவை அனைத்தும் விரைவான பரிணாம வளர்ச்சியின் செயல்பாட்டில் உள்ளன.
சுகோனை உதாரணமாக எடுத்துக்கொண்டால், 2 ஆண்டுகள் மற்றும் 0 மாதங்களில், சுகோன் DeepAI ஆழமான கம்ப்யூட்டிங் நுண்ணறிவு இயந்திர தீர்வை அறிமுகப்படுத்தினார், இது GPU மேம்பாட்டு கருவி தொகுப்பு, AI அடிப்படை மென்பொருள் அடுக்கு மற்றும் பெரிய மாதிரி பயன்பாட்டு மேம்பாட்டு தளத்தை ஒருங்கிணைக்கிறது, உள்நாட்டு AI கம்ப்யூட்டிங் சக்தியை மிகவும் பொருந்தக்கூடியதாகவும் பயன்படுத்தவும் சிறப்பானதாக மாற்றும் நோக்கத்துடன், மற்றும் பில்லியன் அளவிலான மாதிரிகளின் இறுதி முதல் இறுதி வரை அனுமானிப்பதில் இருந்து நூற்றுக்கணக்கான பில்லியன் மாடல்களின் கிளவுட் பயிற்சி வரை முழு-காட்சி தேவைகளை மேம்படுத்துகிறது.
CUDA மற்றும் Rcom டூயல்-ஸ்டாக் சுற்றுச்சூழல் அமைப்புகளுடன் முழுமையாக இணக்கமாக இருப்பதன் மூலம், DeepAI டீப் கம்ப்யூட்டிங் இன்டெலிஜென்ட் என்ஜின் 1+ ஆபரேட்டர்களை ஆதரிக்கிறது, மேலும் CUDA இன் ஆபரேட்டர் கவரேஜ் 0% ஐ விட அதிகமாக உள்ளது, மேலும் உள்நாட்டு GPU ஒற்றை அட்டை பயிற்சி மற்றும் புஷ் செயல்திறனை கையேடு ஆபரேட்டர் தேர்வுமுறை, தொகுப்பு தேர்வுமுறை மற்றும் சட்டசபை அறிவுறுத்தல்-நிலை தேர்வுமுறை மூலம் 0 மடங்குக்கு மேல் மேம்படுத்தலாம்.
உலகின் பெரிய மொழி மாதிரிகள் கிட்டத்தட்ட ஒவ்வொரு இரண்டு வாரங்களுக்கும் உருவாகின்றன, மேலும் அடிப்படை மாதிரி இன்னும் முழு AI பயன்பாட்டு சுற்றுச்சூழல் அமைப்பின் முக்கிய இயந்திரமாக உள்ளது, இது ஆழமான அனுமான திறன்கள், மல்டிமாடல் புரிதல் மற்றும் தொடர்பு திறன்களை வழங்குவதன் மூலம், பன்முகப்படுத்தப்பட்ட மற்றும் உயர்தர சேவைகளை ஆதரித்தல் மற்றும் பல்வேறு வகையான அளவு மாதிரிகளின் அடிப்படையில் சிக்கலான, இலகுரக மற்றும் அதிக ஆய்வு தேவைகளை பூர்த்தி செய்கிறது.
"AI பயன்பாடுகளை ஆராயும் செயல்பாட்டில், பல வாடிக்கையாளர்கள் பெரிய மொழி மாதிரிகளை ஆதரிக்கும் உள்கட்டமைப்பு திறன்கள், குறிப்பாக அனுமான சேவை திறன்கள், AI பயன்பாட்டு சேவைகளின் மென்மையான, மென்மையான, நிலையான மற்றும் திறமையான செயல்பாட்டை உறுதி செய்வதற்கான முக்கியமான உள்கட்டமைப்பாகும், மேலும் கிளவுட் கம்ப்யூட்டிங் AI ஆல் மெதுவாக மாறுகிறது, இதனால் அனைத்து AI பயிற்சி, அனுமானம் மற்றும் பயன்பாடுகள் கிளவுட் உள்கட்டமைப்பில் மிகவும் நிலையாகவும் திறமையாகவும் இயங்க முடியும்."
மாடல் திறன் போதுமான அளவு வலுவாக இருக்கும்போது, AI பயன்பாடுகள் வெளிவரவிருக்கும் போது, மாதிரி அடிப்படையிலான AI பயன்பாட்டு மேம்பாட்டிற்கு அதிகமான வாடிக்கையாளர்களுக்கு இன்னும் முழுமையான மற்றும் முழுமையான கருவிச் சங்கிலி தேவைப்படுகிறது, மேலும் AI மேம்பாட்டு கருவிகள் பெரிய மொழி மாதிரிகள் மற்றும் உண்மையான பயன்பாடுகளுக்கு இடையே ஒரு முக்கியமான பாலமாகும் என்றும் அவர் கூறினார்.
Sugon's DeepAI ஆழமான கம்ப்யூட்டிங் நுண்ணறிவு இயந்திரம் ஒரு உள்ளமைக்கப்பட்ட DAP நிறுவன அளவிலான முழு-அடுக்கு AI பயன்பாட்டு மேம்பாட்டு தளத்தையும் கொண்டுள்ளது, இது பல மாதிரி திறந்த மேலாண்மை, உயர் செயல்திறன் அனுமான சேவைகள், அறிவு இணைவு மேம்பாடு, முகவர் காட்சி இசைக்குழு, நுண்ணறிவு தரவு பகுப்பாய்வு மற்றும் பிற செயல்பாடுகளை வழங்குகிறது, இதனால் நிறுவன வாடிக்கையாளர்கள் உள்நாட்டு AI கம்ப்யூட்டிங் தளத்தில் ஒரே நிறுத்தத்தில் DeepSeek மற்றும் Ali QwQ போன்ற பெரிய மாதிரி பயன்பாடுகள் மூலம் இயக்க முடியும்.
AI-சார்ந்த டெவலப்பர்கள் இரண்டு முக்கிய சவால்களை எதிர்கொள்கின்றனர் என்று சன் யூகுன் நம்புகிறார்: முதலாவது, போதுமான கணினி சக்தி மற்றும் அதிக செலவு. ஒரு நல்ல மாதிரிக்கு வான்கா அல்லது ஒரு பெரிய கிளஸ்டர் தேவைப்படலாம், ஆனால் இப்போது வெளிநாட்டு கணினி சக்தி அடிப்படையில் கிடைக்கவில்லை, மேலும் உள்நாட்டு கணினி சக்தி சூழலியல் இன்னும் ஒன்றாக வளர்க்கப்படுகிறது. இரண்டாவதாக, மேம்பாட்டு கருவி சங்கிலி ஆதரவு போதுமானதாக இல்லை, மேலும் வளர்ச்சி சூழல் உள்ளமைவு சிக்கலானது. சாதனம் மற்றும் மேகக்கணியின் சூழல் ஒரே மாதிரியாக இல்லை, இது பெரிய மாதிரிகள் மற்றும் முகவர்கள் போன்ற பயன்பாடுகளின் விரைவான மறு செய்கையின் தேவைகளைப் பூர்த்தி செய்வது கடினம்.
மேம்பாட்டு சூழலைப் பயன்படுத்துவதற்கான செயல்முறை சிக்கலானது என்றும், பல தொடக்கநிலையாளர்கள் செயற்கை நுண்ணறிவு வளர்ச்சியின் முதல் தடையாக உள்ளனர், பெரிய மாதிரிகள் லினக்ஸ் திறந்த மூல மற்றும் நிலையான கணினி சேவையகங்களின் அடிப்படையில் பயிற்சி அளிக்கப்படுகின்றன, மேலும் பல செயற்கை நுண்ணறிவு மேம்பாட்டு கட்டமைப்புகள் லினக்ஸ் வளர்ச்சியை அடிப்படையாகக் கொண்டவை என்றும் அவர் கூறினார். கருவிச் சங்கிலி மற்றும் சார்பு நூலகங்களின் பதிப்புகளில் உள்ள வேறுபாடுகள், சிக்கல்களை ஏற்படுத்தும் அளவுக்கு நல்லதல்ல, வளர்ச்சியின் சிக்கலை அதிகரிப்பது மட்டுமல்லாமல், டெவலப்பர்களுக்கு தேவையற்ற ஆற்றலையும் நிறைய பயன்படுத்துகின்றன.
கூடுதலாக, டெவலப்பர் சூழலை உள்ளமைக்க கடுமையாக உழைத்திருந்தாலும், சொந்த லினக்ஸுடன் ஒப்பிடும்போது செயல்திறனில் வேறுபாடுகள் உள்ளன, CPU கம்ப்யூட்டிங் செயல்திறன் மட்டுமல்ல, GPU மாதிரி பயிற்சியும் சில இழப்புகளைக் கொண்டுள்ளது, சிறிய மாதிரி பயிற்சி செய்ய விண்டோஸ் கணினிகளைப் பயன்படுத்துவதற்கான செயல்திறன் தரமானதாக இல்லை, மற்றும் சொந்த லினக்ஸ் அமைப்பு உயர் மட்ட செயல்திறனை அடைய முடியும், எனவே செயற்கை நுண்ணறிவு வளர்ச்சிக்கு நீங்கள் லினக்ஸை மாஸ்டர் செய்ய வேண்டும்.
Aishu Intelligence தனது சொந்த AIBOOK கம்ப்யூட்டிங் சக்தியையும் அறிமுகப்படுத்தியுள்ளது, இது 50TOPS எண்ட்-சைட் கம்ப்யூட்டிங் சக்தியை மையமாக அடிப்படையாகக் கொண்டது, மேலும் சந்தையில் இருக்கும் AI PCகளிலிருந்து AI கம்ப்யூட்டிங் சக்தியை வேறுபடுத்த விரும்புகிறது.
Sun Yukun இன் பார்வையில், AIPC இலிருந்து வேறுபட்டது, AI கம்ப்யூட்டிங் சக்தி என்பது சொந்த லினக்ஸ் மேம்பாட்டு சூழலை அடிப்படையாகக் கொண்ட ஒரு இறுதி-பக்க AI மேம்பாட்டு கருவியாகும், மேலும் சந்தையில் உள்ள முக்கிய AIPC உடனான முக்கிய வேறுபாடுகள் லினக்ஸ் கர்னலை அடிப்படையாகக் கொண்ட AI சொந்த இயக்க முறைமை, பல்வேறு நடைமுறை AI பயன்பாடுகளுடன் முன்பே நிறுவப்பட்டது, மேலும் AI இன் "பெட்டிக்கு வெளியே" AI கம்ப்யூட்டிங் சக்தியை அடைய, மற்றும் அதே நேரத்தில் "சாதனம்-கிளவுட் ஒருங்கிணைப்பு" AI கம்ப்யூட்டிங் சக்தியைக் கொண்டுள்ளது, சாதனப் பக்கம் AIBOOK உள்ளூர் கம்ப்யூட்டிங்கைக் குறிக்கிறது, மற்றும் கிளவுட் பக்கம் Moore Threads Kua E கிளவுட் கம்ப்யூட்டிங். சாதனம்-கிளவுட் ஒருங்கிணைப்பு பெரிய மாதிரி வரிசைப்படுத்தல் முதல் பயன்பாடு, ஃபைன்-டியூனிங் மற்றும் பயிற்சி வரை முழு AI மேம்பாட்டு சூழ்நிலையையும் உள்ளடக்கியது.
முந்தைய இறுதி-பக்க அனுமானத்தின் வரம்புகளுடன் ஒப்பிடும்போது, அதிக எண்ணிக்கையிலான உயர்தர சிறிய மாதிரிகளின் தோற்றம் மீண்டும் அனுமான பணிச்சுமைக்கு கவனத்தை ஈர்த்துள்ளது, மேலும் கிளவுட் கம்ப்யூட்டிங் சக்தி மற்றும் முனைய கம்ப்யூட்டிங் சக்தி சூழலியல் நீண்ட காலத்திற்கு தொடர்ந்து உருவாகும்.
杰文斯悖论告诉我们,技术效率提升反而会刺激需求扩张。例如,DeepSeek通过FP8混合精度训练、动态稀疏算法等技术将单次训练成本降低53%(至557.6万美元),但头部企业因此增加并行实验次数(从年均3次跃升至28次),反而推高全球算力芯片采购量。类似现象在能源领域也曾出现(如蒸汽机效率提升后煤炭消耗激增)。在AI领域,推理成本降低将加速应用场景泛化(如金融、医疗、智能制造),最终导致算力总需求增长。
NVIDIA GTC1 இல் Huang Jenxun ChatGPT என்பது ஒரு ஜெனரேட்டிவ் AI ஆகும், இது அடுத்த டோக்கன்களை முன்னறிவிப்பதை நம்பியுள்ளது மற்றும் மாயத்தோற்றத்தின் அதிக நிகழ்தகவைக் கொண்டுள்ளது, இப்போது அது டீப் ரிசர்ச் மற்றும் மனுஸ் போன்ற ஏஜென்டிக் AI பயன்பாடுகளில் நுழைந்துள்ளது. அனுமான மாதிரிகளுக்கு அதிக கணக்கீடு தேவைப்படுகிறது, ஏனெனில் மாதிரிகள் மிகவும் சிக்கலானவை. R0 இன் அளவு 0 பில்லியன் அளவுருக்கள், மற்றும் அதன் அடுத்த தலைமுறை பதிப்பில் டிரில்லியன் கணக்கான அளவுருக்கள் இருக்கலாம். DeepSeek-R0 போன்ற அனுமானங்களைச் செய்ய ஏஜென்டிக் AI பயன்பாடுகள் எண்ணற்ற முறை செயல்படுத்தப்படுகின்றன, மேலும் தேவையான கணக்கீடு அதிகமாக இருக்கும்.
Qualcomm ஆல் வெளியிடப்பட்ட வெள்ளை அறிக்கையில், முனையப் பக்கத்தில் AI அனுமான செயல்பாடுகளின் பரவலான புகழ் ஜெனரேட்டிவ் AI பயன்பாடுகள் மற்றும் உதவியாளர்களின் செல்வத்தை உருவாக்க உதவியது என்றும் குறிப்பிடுகிறது. ஆவண சுருக்கம், AI பட உருவாக்கம் மற்றும் எடிட்டிங் மற்றும் நிகழ்நேர மொழி மொழிபெயர்ப்பு ஆகியவை இப்போது பொதுவான அம்சங்களாகிவிட்டன. இமேஜிங் பயன்பாடுகள் கணக்கீட்டு புகைப்படம் எடுத்தல், பொருள் அங்கீகாரம் மற்றும் நிகழ்நேர காட்சி தேர்வுமுறை ஆகியவற்றிற்கு AI ஐப் பயன்படுத்தலாம்.
இது பணக்கார, அதிக சூழல் விழிப்புணர்வு மற்றும் தனிப்பயனாக்கப்பட்ட அனுபவங்களை வழங்க பல தரவு வகைகளை (உரை, காட்சி, ஆடியோ மற்றும் சென்சார் உள்ளீடுகள்) இணைக்கும் மல்டிமோடல் பயன்பாடுகளின் வளர்ச்சிக்கு வழிவகுத்தது. Qualcomm AI Engine ஆனது சாதனப் பக்கத்தில் இதுபோன்ற பணிகளை மேம்படுத்த NPUகள், CPUகள் மற்றும் GPUகளைத் தனிப்பயனாக்கும் திறனை ஒருங்கிணைக்கிறது, AI உதவியாளர்கள் வெவ்வேறு தகவல்தொடர்பு முறைகளுக்கு இடையில் மாறவும் மல்டிமாடல் வெளியீடுகளை உருவாக்கவும் உதவுகிறது.
Agentic AI அடுத்த தலைமுறை பயனர் தொடர்புகளின் இதயத்தில் உள்ளது. AI அமைப்புகள் பயனர் தேவைகளை எதிர்பார்ப்பதன் மூலமும், இறுதிப்புள்ளிகள் மற்றும் பயன்பாடுகளுக்குள் சிக்கலான பணிப்பாய்வுகளை முன்கூட்டியே செயல்படுத்துவதன் மூலமும் முடிவுகளை எடுக்கவும் பணிகளை நிர்வகிக்கவும் திறன் கொண்டவை. சில நிகழ்நேர AI செயலாக்கப் பணிகள் சாதனப் பக்கத்தில் பாதுகாப்பாக இயங்க முடியும், அதே நேரத்தில் மேகக்கணியை நம்பாமல், பயனர் விருப்பத்தேர்வுகள் மற்றும் தேவைகளை துல்லியமாக வரையறுக்க தனிப்பட்ட அறிவு வரைபடங்களை நம்பியுள்ளது.
AI இறுதிப் பக்கத்தின் வளர்ச்சி குறித்து Aishu Intelligence நம்பிக்கையுடன் உள்ளது. இருப்பினும், கிளவுட் கம்ப்யூட்டிங்கால் ஆதிக்கம் செலுத்தும் AI மேம்பாட்டு முன்னுதாரணத்தை இது சீர்குலைக்காது, எதிர்காலத்தில் இறுதி-கிளவுட் ஒத்துழைப்பு முக்கிய போக்காக இருக்கும் என்று சன் யூகுன் குறிப்பிட்டுள்ளார், AI கம்ப்யூட்டிங் தூய கிளவுடில் இருந்து "கிளவுட்-எட்ஜ்-எண்ட்" ஒத்துழைப்புக்கு ஒரு முன்னுதாரண மாற்றத்திற்கு உட்பட்டுள்ளது, 13G, எட்ஜ் கம்ப்யூட்டிங் மற்றும் பிற தொழில்நுட்பங்கள் விநியோகிக்கப்பட்ட கம்ப்யூட்டிங்கின் தாமதத்தை ஏற்றுக்கொள்ளக்கூடிய வரம்பிற்கு குறைக்கின்றன, மற்றும் இறுதி-பக்க AI சில்லுகளின் கணினி சக்தி 0TOPS மற்றும் அதற்கு மேல் அடைந்துள்ளது, இது மிகவும் சிக்கலான பணிகளை மேற்கொள்ள முடியும், மேலும் மாதிரி சுருக்க தொழில்நுட்பம் (வடிகட்டுதல் மற்றும் குவாண்டமாக்கல் போன்றவை) 0B போன்ற சிறிய-அளவுரு மாதிரிகளை சாதனப் பக்கத்தில் உள்ள மேகக்கணியில் 0B மாதிரியின் திறன் நிலைக்கு நெருக்கமான நிலையை அடையச் செய்கிறது.
"இலகுரக மாதிரிகள் மூலம் சாதன பக்க கம்ப்யூட்டிங் சக்தியின் இடையூறை உடைப்பது மற்றும் சாதனங்கள் மற்றும் மேகங்களின் ஒருங்கிணைப்பு மூலம் திறன்களின் நெகிழ்வான விரிவாக்கத்தை உணர்ந்து கொள்வது AI கம்ப்யூட்டிங் சக்தியின் புதிய முன்னுதாரணத்தை வரையறுக்கிறது. இந்த கட்டமைப்பின் கீழ், பயனர்கள் AI இன் 'தடையற்ற அனுபவத்தை' பெறுவார்கள், சாதனத்தின் பக்கத்திலிருந்து தினசரி காட்சிகளுக்கு விரைவான பதில் மற்றும் மேகக்கணிக்கு சிக்கலான பணிகள், மற்றும் அறிவார்ந்த அனுபவத்தை மேம்படுத்த இருவரும் ஒன்றிணைந்து செயல்படுவார்கள். இவ்வாறு அவர் கூறினார்.
உள்ளூர் சேவைகளுக்கு சிறப்பாக சேவை செய்வதற்காக, குறிப்பாக சில அரசு மற்றும் நிறுவன வாடிக்கையாளர்களின் ஒழுங்குமுறை தேவைகளைப் பூர்த்தி செய்வதற்காக, அலிபாபா கிளவுட் ஒன்-கிளவுட் மல்டி-கோர் பலபடித்தான கம்ப்யூட்டிங் போன்ற வாடிக்கையாளர் தேவைகளை ஆதரிப்பதற்காக பெய்லியனின் சிறப்பு பதிப்பை அறிமுகப்படுத்தியுள்ளது.
AI நடைமுறை பயன்பாடுகளின் விளைவை நேரடியாக பாதிக்கும் கம்ப்யூட்டிங் வளங்கள் முதல் கூறு அழைப்புகள் வரை, அலிபாபா கிளவுட் முழு-ஸ்டாக் AI ஐ முன்மொழிந்துள்ளது, இது ஒரு பெரிய மாடல் மட்டுமல்ல, கிளவுட் தொழில்நுட்ப கட்டமைப்பு அடுக்கு மட்டுமல்ல, அடிப்படை பலபடித்தான கம்ப்யூட்டிங் சக்தி, மாதிரி சேவை தளம், பெய்லியன் தளம் மற்றும் மேலே உள்ள அனைத்து வாடிக்கையாளர் சார்ந்த வாடிக்கையாளர்களும் உட்பட, தொழில்நுட்ப கட்டமைப்பு மட்டத்தில் கணினி வளங்களுக்கான தேவை அதிகரித்து வருகிறது, மேலும் GPU தேவையின் வளர்ச்சி விகிதம் பாரம்பரிய CPUகளின் வளர்ச்சி விகிதத்தை விட மிக அதிகமாக உள்ளது. இந்த கிளஸ்டர்கள் நிகழ்நேர அனுமான பயன்பாடுகளின் தேவைகளைப் பூர்த்தி செய்யும் போது பெரிய அளவிலான பயிற்சி பணிகளை ஆதரிக்கின்றன.(இந்த கட்டுரை முதலில் வெளியிடப்பட்டது டைட்டானியம் மீடியா APP, |.) ஜாங் ஷுவாய், ஆசிரியர் | கை ஹோங்டா)