"Cơn sốt vàng" của mô hình AI đang giảm dần, và "những người bán xẻng" đang lễ hội hóa trang
Cập nhật vào: 08-0-0 0:0:0

文 | 极智GeeTech

Khi mọi người đi đào vàng, bán xẻng là có lợi nhất.

Ở California vào thế kỷ 19, vô số người với ước mơ giàu có đổ vào các mỏ vàng, nhưng ít ai nhận ra rằng không phải những người thợ mỏ thực sự kiếm được nhiều tiền, mà là những thương nhân bán xẻng và quần jean. Giờ đây, "cơn sốt vàng" do các mô hình lớn gây ra đã càn quét thế giới, và trong lễ hội công nghệ và kinh doanh này, cơ sở hạ tầng AI (AI Infra) đang đóng vai trò chủ chốt tương tự như "người bán xẻng".

Từ GPT-3 đến PaLM, từ Wenxin Yiyan đến Tongyi Qianwen, quy mô tham số của các mô hình lớn đã tăng theo cấp số nhân, chi phí đào tạo thường lên đến hàng chục triệu đô la và sức mạnh tính toán cần thiết để suy luận đã tăng theo cấp số nhân. Trong cuộc cạnh tranh này, GPU của Nvidia đang thiếu hụt, chip Ascend của Huawei đang nổi lên và những gã khổng lồ điện toán đám mây đã tăng cường cơ sở hạ tầng máy tính của họ.

Khi thị trường tập trung vào sự đột phá công nghệ của chính mô hình lớn, AI Infra, hệ thống hỗ trợ cơ bản bao gồm chip, máy chủ, điện toán đám mây, khung thuật toán, trung tâm dữ liệu, v.v., đang trở thành chiến trường quan trọng quyết định kết quả của cuộc chiến. CICC dự đoán rằng ngành công nghiệp cơ sở hạ tầng AI hiện tại đang ở giai đoạn đầu của sự tăng trưởng nhanh chóng và trong 30-0 năm tới, không gian thị trường của các phân khúc khác nhau dự kiến sẽ duy trì tốc độ tăng trưởng nhanh 0%, đang trở thành một lựa chọn kinh doanh tuyệt vời cho "cốm và xẻng" đằng sau sự bùng nổ của các ứng dụng mô hình lớn.

Chìa khóa mới để mở khóa năng suất AI

Nhìn lại sự phát triển của ngành công nghiệp ICT, kiến trúc ba tầng được đại diện bởi cơ sở hạ tầng, nền tảng và ứng dụng dường như đã trở thành một xu hướng tất yếu trong quá trình phát triển của nó.

Trong giai đoạn triển khai tại chỗ truyền thống, phần mềm cơ bản như hệ điều hành, cơ sở dữ liệu và phần mềm trung gian đóng một vai trò không thể thiếu, giải quyết hiệu quả sự phức tạp của hệ thống phần cứng cơ bản bằng cách kiểm soát tương tác phần cứng, quản lý lưu trữ dữ liệu, lên lịch giao tiếp mạng và các chức năng khác, để các nhà phát triển ứng dụng lớp trên có thể tập trung vào đổi mới logic kinh doanh.

Trong kỷ nguyên "đám mây xác định mọi thứ", kiến trúc đồng phát triển Cơ sở hạ tầng dưới dạng dịch vụ (IaaS), Nền tảng dưới dạng dịch vụ (PaaS) và Phần mềm dưới dạng dịch vụ (SaaS) cổ điển ra đời. Trong số đó, môi trường phát triển ứng dụng và dịch vụ quản lý phân tích dữ liệu được cung cấp bởi lớp PaaS đã đặt nền tảng vững chắc cho sự thâm nhập rộng rãi của điện toán đám mây.

Sau một thời gian dài ngủ đông, AIGC giống như nhấn nút tua đi nhanh của quá trình khái quát hóa AI, và toàn bộ ngành công nghiệp đang đẩy nhanh quá trình tái thiết trong một bầu không khí mạnh mẽ. Sức mạnh tính toán và ứng dụng chắc chắn đã trở thành tâm điểm chú ý nhất, nhưng có khoảng cách rất lớn giữa hai điều này, điều này khiến mô hình lớn phải đối mặt với nguy cơ "bay lên" và không thể hạ cánh hoặc "bước lên không trung" và bỏ lỡ cơ hội.

Nếu AI được so sánh với điện toán đám mây, sức mạnh tính toán, thuật toán và dữ liệu có thể được coi là các lớp IaaS, trong khi các mô hình mã nguồn mở và mã nguồn đóng khác nhau là sự phát triển mới của SaaS trong kỷ nguyên của các mô hình lớn, đó là "Mô hình như một dịch vụ (MaaS)".

Là một cơ sở hạ tầng lớp trung gian kết nối sức mạnh tính toán và các ứng dụng, AI Infra tập trung vào các kịch bản triển khai tư nhân hóa các ứng dụng AI cấp doanh nghiệp, bao gồm phần cứng, phần mềm, chuỗi công cụ, phương pháp tối ưu hóa và các khía cạnh khác, đồng thời cam kết phát triển, triển khai, vận hành và quản lý các ứng dụng mô hình lớn bằng cách xây dựng ngăn xếp phần mềm mới và các dịch vụ toàn diện, tạo ra nền tảng công cụ cơ bản và triển khai sức mạnh tính toán mô hình một cửa, đồng thời trở thành lực lượng cốt lõi kết nối sức mạnh tính toán và ứng dụng.

AI Infra bao gồm tất cả các công cụ và quy trình liên quan đến phát triển và triển khai. Với sự phát triển không ngừng của điện toán đám mây, một loạt các khái niệm được đại diện bởi "XOps", chẳng hạn như DataOps, ModelOps, DevOps, MLOps và LLMOps, đã xuất hiện.

Ở cấp độ vĩ mô, bản chất của tất cả các XOps là nâng cao hiệu quả của vòng đời phát triển và triển khai. Ví dụ, DataOps nhằm mục đích cải thiện hiệu quả lưu trữ của lớp IaaS và hiệu quả xử lý dữ liệu của lớp PaaS. DevOps và MLOps tập trung vào việc nâng cao hiệu quả phát triển và triển khai tại lớp PaaS. LLMOps chủ yếu cung cấp hỗ trợ hiệu quả cho lớp MaaS.

Tài nguyên máy tính truyền thống có vấn đề về tỷ lệ sử dụng thấp và tiêu thụ năng lượng cao trong quá trình sử dụng. AI Infra thực hiện việc phân bổ động và sử dụng hiệu quả tài nguyên máy tính thông qua các thuật toán lập lịch thông minh và công nghệ tính toán không đồng nhất. Thuật toán lập lịch thông minh có thể tự động phân bổ tài nguyên cụm GPU dựa trên mức độ ưu tiên, quy mô dữ liệu và yêu cầu tính toán của tác vụ đào tạo mô hình, cải thiện việc sử dụng sức mạnh tính toán từ khoảng 75% lên hơn 0%.

Công nghệ tính toán không đồng nhất tích hợp ưu điểm của CPU, GPU, NPU và các chip khác để tối ưu hóa cho các loại tác vụ tính toán khác nhau, giảm hơn 30% chi phí tiêu thụ năng lượng trong khi vẫn đảm bảo hiệu suất tính toán. Ví dụ, trong các tác vụ nhận dạng hình ảnh, NPU có thể phát huy tối đa khả năng tính toán song song mạnh mẽ của nó để xử lý nhanh chóng một lượng lớn dữ liệu hình ảnh. Trong giai đoạn tiền xử lý dữ liệu, CPU có thể hoàn thành hiệu quả các tác vụ như đọc và làm sạch dữ liệu.

AI Infra cung cấp một bộ chuỗi công cụ thuật toán hoàn chỉnh, bao gồm toàn bộ quá trình phát triển mô hình lớn như tiền xử lý dữ liệu, đào tạo mô hình và tối ưu hóa suy luận. Trong số đó, các công cụ AutoML (automated machine learning) có thể tự động lựa chọn kiến trúc mô hình và siêu tham số tối ưu, để các nhà phát triển có thể nhanh chóng xây dựng mô hình mà không cần kiến thức học máy sâu, rút ngắn chu kỳ phát triển từ vài tháng xuống còn vài tuần.

Công nghệ nén mô hình có thể giảm kích thước của mô hình hơn 90% thông qua cắt tỉa và lượng tử hóa, giúp giảm đáng kể các yêu cầu lưu trữ và tính toán của mô hình mà không ảnh hưởng đến hiệu suất của mô hình, giúp việc triển khai mô hình trên thiết bị di động và thiết bị biên hiệu quả hơn. Sự xuất hiện của các công cụ này đã cho phép các nhà phát triển và doanh nghiệp vừa và nhỏ dễ dàng sử dụng các mô hình lớn để phát triển ứng dụng, đẩy nhanh việc phổ biến và ứng dụng công nghệ mô hình lớn.

Việc đào tạo và ứng dụng các mô hình lớn không thể tách rời với dữ liệu chất lượng cao. Tuy nhiên, quá trình thu thập, dọn dẹp, dán nhãn dữ liệu thường tốn thời gian và công sức, dễ gặp phải các vấn đề như chất lượng dữ liệu thấp và rủi ro bảo mật dữ liệu. Nền tảng quản lý dữ liệu của AI Infra xây dựng một vòng khép kín dữ liệu hiệu quả thông qua các công cụ chú thích tự động, thuật toán tăng cường dữ liệu và công nghệ điện toán bảo vệ quyền riêng tư.

Công cụ chú thích tự động sử dụng các thuật toán học máy để tự động chú thích dữ liệu, với tỷ lệ chính xác hơn 95%, giúp cải thiện hiệu quả chú thích. Thuật toán tăng cường dữ liệu có thể tạo ra nhiều dữ liệu đào tạo hơn bằng cách chuyển đổi và làm phong phú dữ liệu gốc, để cải thiện khả năng khái quát hóa của mô hình. Công nghệ điện toán bảo vệ quyền riêng tư có thể thực hiện chia sẻ dữ liệu và sử dụng cộng tác trên cơ sở đảm bảo bảo mật dữ liệu và quyền riêng tư, phá vỡ các silo dữ liệu và giải phóng giá trị tiềm năng của dữ liệu.

Trước khi AIGC trỗi dậy, nghiên cứu lý thuyết và khám phá thực tế về nền tảng trung gian AI đã diễn ra sôi nổi. Tuy nhiên, vào thời điểm đó, nền tảng trung gian AI giống như một "lính cứu hỏa", với các chức năng phức tạp và đa dạng, đảm nhận rất nhiều công việc cơ bản và tầm thường, nhưng rất khó để có được sự công nhận rộng rãi từ thượng nguồn và hạ nguồn.

Sự xuất hiện của các mô hình lớn đã xây dựng một giai đoạn rộng lớn hơn cho nền tảng hóa AI, đồng thời làm cho mô hình kinh doanh của AI Infra chắc chắn hơn, do đó giành được không gian phát triển đáng kể.

Cũng giống như có thể có vô số kết hợp bánh sandwich giữa hai lát bánh mì trong một "bánh sandwich", AI Infra, giữa sức mạnh tính toán và ứng dụng, cũng có đầy đủ khả năng. Nói chung, AI Infra bao gồm công nghệ khung cơ bản của trí tuệ nhân tạo, liên quan đến các cơ sở cơ bản khác nhau trong lĩnh vực đào tạo và triển khai mô hình lớn. Theo nghĩa hẹp, ngăn xếp phần mềm cơ bản là thành phần cốt lõi của AI Infra và mục tiêu chính của nó là tối ưu hóa các thuật toán tính toán và thúc đẩy việc triển khai các ứng dụng.

Đối với người dùng cấp doanh nghiệp, AI Infra có bốn giá trị cốt lõi và đóng vai trò quan trọng trong việc thúc đẩy chuyển đổi kỹ thuật số và nâng cấp thông minh của doanh nghiệp.

Đầu tiên, hãy tập trung vào việc quản lý toàn bộ vòng đời của các ứng dụng AI. Nền tảng AI Infra không chỉ hỗ trợ kỹ thuật cho doanh nghiệp mà còn giúp doanh nghiệp nhanh chóng khám phá và phát triển các kịch bản ứng dụng AI đáp ứng nhu cầu kinh doanh của mình thông qua nhiều công cụ khác nhau: đơn giản hóa việc quản lý mô hình, dù tại chỗ, biên hay trên đám mây; Triển khai và suy luận nhanh chóng, cho dù trong máy ảo hay môi trường container; Hỗ trợ mô hình phong phú, mô hình hệ thống đặt trước và mô hình tùy chỉnh; và các khả năng như tinh chỉnh và tối ưu hóa mô hình, đánh giá mô hình và kiểm tra hiệu suất.

Thứ hai, đẩy nhanh việc triển khai các ứng dụng AI cấp doanh nghiệp. Nền tảng AI Infra không chỉ cung cấp hỗ trợ kỹ thuật cho doanh nghiệp mà còn giúp doanh nghiệp nhanh chóng khám phá và phát triển các kịch bản ứng dụng AI đáp ứng nhu cầu của doanh nghiệp thông qua nhiều công cụ khác nhau. Điều này bao gồm khai thác kịch bản dựa trên dữ liệu, hỗ trợ xây dựng ứng dụng AI, bao gồm kỹ thuật nhanh chóng, truy xuất vectơ và quản lý cơ sở tri thức, với quyền truy cập linh hoạt vào các mô hình cục bộ hoặc trực tuyến. Đề xuất chính xác kịch bản thông minh, không chỉ hỗ trợ các ứng dụng AI nói chung mà còn tích hợp các giải pháp AI đa dạng. Tạo mẫu và xác minh nhanh, xây dựng và thử nghiệm nhanh các nguyên mẫu AI; Các mẫu ngành và hỗ trợ trải nghiệm, các mẫu kịch bản AI được xây dựng sẵn, không cần phải bắt đầu lại từ đầu, hạ thấp ngưỡng kỹ thuật.

Thứ ba, giúp doanh nghiệp xây dựng hạ tầng số mới. Nền tảng AI Infra không chỉ là nền tảng phát triển và quản lý ứng dụng AI mà còn là công cụ quan trọng để doanh nghiệp xây dựng cơ sở hạ tầng kỹ thuật số mới. Nó bao gồm tính toán đàn hồi và lập lịch tài nguyên, hỗ trợ tăng tốc phần cứng GPU không đồng nhất và cung cấp khả năng mở rộng linh hoạt của tài nguyên điện toán kim loại trần, máy ảo và bộ chứa. Bằng cách hỗ trợ kiến trúc đám mây chéo và đám mây lai cũng như triển khai liên khu vực, nó cung cấp khả năng lập lịch trình tài nguyên đám mây linh hoạt. Quản lý thống nhất và O&M tự động, tích hợp các công cụ O&M thông minh và giao diện quản lý thống nhất; Nó có khả năng điện toán biên để giảm độ trễ truyền tải đám mây và áp lực băng thông, đồng thời phù hợp với các tình huống kinh doanh thời gian thực cao. Tăng cường quản trị và tuân thủ dữ liệu để giúp các tổ chức tuân thủ các tiêu chuẩn ngành và yêu cầu quy định để bảo vệ quyền riêng tư và bảo mật dữ liệu.

Thứ tư, thúc đẩy nâng cấp chiến lược kỹ thuật số và thông minh của doanh nghiệp. Thông qua sự hỗ trợ kép của số hóa và trí tuệ, nền tảng AI Infra thúc đẩy doanh nghiệp nâng cao hiệu quả kinh doanh, thực hiện ra quyết định AI và hoạt động tự động, sau đó thực hiện nâng cấp chiến lược trí tuệ kỹ thuật số, tích hợp sâu AI vào tất cả các khía cạnh của kinh doanh và thúc đẩy đổi mới kinh doanh toàn diện bằng cách tăng tốc các ứng dụng suy luận AI.

AI Infra sẽ là chiến trường tiếp theo?

So với việc theo đuổi giá trị mô hình, nó đã trở thành một sự đồng thuận chung trong ngành để cống hiến hết mình cho lĩnh vực ứng dụng AI và hàng triệu ứng dụng sẽ được sinh ra trên mô hình cơ bản và những ứng dụng này sẽ biến đổi định dạng kinh doanh hiện có nhiều hơn so với sự đổi mới đột phá từ đầu.

Ngày nay, nguồn cung ứng ứng dụng AI đang bùng nổ. Kể từ đầu năm 2024, các sản phẩm mô hình tạo video đã xuất hiện mạnh mẽ, chẳng hạn như Keling của Kuaishou, Jimeng của ByteDance và Vimi của SenseTime.

大模型应用的爆发趋势已然明晰。根据InfoQ研究中心的数据,到2030年,通用人工智能(AGI)应用市场规模将达到4543.6亿元。模型应用层所蕴含的巨大机遇,吸引了几乎各行各业的积极参与。

Hiện tại, thị trường AI Infra vẫn đang trong giai đoạn hỗn loạn, thị trường trong nước đang cho thấy mô hình "khổng lồ thống trị". Những gã khổng lồ công nghệ như Huawei, Alibaba và Baidu đã xây dựng các hệ thống AI Infra tương đối khép kín với sức mạnh kỹ thuật mạnh mẽ và lợi thế tài nguyên.

Ví dụ, mô hình của Huawei áp dụng kiến trúc ba tầng, với mô hình kiến thức chung với tính mạnh mẽ và khái quát hóa mạnh mẽ ở phía dưới, hoạt động như một nền tảng vững chắc, dựa trên đó các mô hình công nghiệp và mô hình triển khai cho các kịch bản và quy trình làm việc cụ thể. Ưu điểm của kiến trúc này là khi mô hình lớn được đào tạo được triển khai cho các ngành dọc, không cần phải đào tạo lại và chi phí chỉ bằng 7% -0% so với lớp trước, giúp cải thiện đáng kể hiệu quả và giảm chi phí.

Alibaba đã tạo ra một cơ sở thống nhất cho AI, cho dù đó là thị giác máy tính (CV), xử lý ngôn ngữ tự nhiên (NLP) hay các mô hình lớn đồ thị Wensheng, nó đều có thể được đào tạo trong cơ sở thống nhất này. Baidu và Tencent cũng đã thực hiện các bố trí chiến lược tương ứng.

Baidu có biểu đồ tri thức Trung Quốc bao gồm hơn 50 tỷ thực thể, cung cấp hỗ trợ kiến thức phong phú cho sự phát triển AI của mình, giống như một cơ sở tri thức khổng lồ, cung cấp đủ chất dinh dưỡng cho việc đào tạo và ứng dụng mô hình; Công nghệ học khóa học khởi động nóng của Tencent có thể giảm chi phí đào tạo của các mô hình nghìn tỷ đô la xuống còn một phần tám so với khởi động nguội, cải thiện hiệu quả đào tạo và giảm chi phí.

Tuy nhiên, hệ sinh thái khép kín này cũng mang lại một số vấn đề, các nhà cung cấp vừa và nhỏ khó thâm nhập thị trường, dẫn đến thiếu sự phân công lao động chuyên nghiệp trên thị trường, các công ty khởi nghiệp đang phải đối mặt với tình thế tiến thoái lưỡng nan "khó dựa vào các nhà sản xuất lớn, khó tồn tại độc lập", và sức sống và khả năng đổi mới của toàn bộ hệ sinh thái bị hạn chế ở một mức độ nhất định.

Ở nước ngoài, thị trường AI Infra đã hình thành một chuỗi công nghiệp và hệ sinh thái tương đối trưởng thành. Một số tập trung vào chú thích dữ liệu, một số tốt trong việc cải thiện chất lượng dữ liệu và một số có những lợi thế độc đáo trong kiến trúc mô hình. Với tính chuyên nghiệp của mình, các doanh nghiệp này thường làm tốt hơn các nhà máy lớn về hiệu quả, kiểm soát chi phí và đảm bảo chất lượng trong một mắt xích duy nhất.

Ví dụ, tại Hoa Kỳ, một số công ty tập trung vào phân khúc AI Infra đã xuất hiện. Ví dụ, Anomalo tập trung vào kiểm tra chất lượng dữ liệu, cung cấp các dịch vụ đánh giá và tối ưu hóa chất lượng dữ liệu chuyên nghiệp cho các doanh nghiệp như Google Cloud và Notion. Scale AI giúp doanh nghiệp giảm chi phí xử lý dữ liệu và nâng cao hiệu quả ghi nhãn dữ liệu thông qua các công cụ chú thích tự động.

Các doanh nghiệp này tham gia sâu vào các lĩnh vực tương ứng của họ, giống như các nhà cung cấp Cấp 1 trong ngành công nghiệp ô tô, thông qua sự phân công lao động chuyên nghiệp, để cung cấp các giải pháp tiêu chuẩn hóa và chất lượng cao cho các doanh nghiệp mô hình lớn, hình thành một hệ sinh thái lành tính của "các nhà sản xuất lớn tập trung vào nghiên cứu và phát triển mô hình cốt lõi và các nhà cung cấp cung cấp hỗ trợ cơ sở hạ tầng".

Tuy nhiên, sự phát triển trong nước trong khu vực này vẫn chưa trưởng thành. Một mặt, hầu hết các công ty lớn trong lĩnh vực mô hình lớn ở Trung Quốc đều là các nhà sản xuất lớn, và họ đều có hệ thống đào tạo trưởng thành của riêng mình và rất khó để các nhà cung cấp bên ngoài xâm nhập vào hệ thống nội bộ của họ. Dachang giống như một vương quốc khép kín, với hệ thống hoàn chỉnh riêng, rất khó để ngoại lực xâm nhập.

Mặt khác, thiếu một hệ sinh thái kinh doanh đủ lớn và các nhóm doanh nghiệp vừa và nhỏ ở Trung Quốc, điều này khiến các nhà cung cấp AI khó tìm thấy không gian để tồn tại và phát triển bên ngoài các nhà sản xuất lớn.

Lấy Google làm ví dụ, Google sẵn sàng chia sẻ kết quả dữ liệu đào tạo của mình với các nhà cung cấp chất lượng dữ liệu để giúp họ cải thiện khả năng xử lý dữ liệu và khả năng của các nhà cung cấp có thể cung cấp cho Google nhiều dữ liệu chất lượng cao hơn, do đó tạo thành một vòng tròn đạo đức.

Sự không hoàn hảo của hệ sinh thái AI Infra trong nước đã trực tiếp dẫn đến sự gia tăng ngưỡng khởi nghiệp mô hình quy mô lớn. Nếu bắt đầu một mô hình kinh doanh quy mô lớn ở Trung Quốc giống như ăn một bữa ăn nóng, thì các doanh nhân phải bắt đầu từ những công việc cơ bản nhất như cải tạo đất, trồng trọt, phải đối mặt với những thách thức và khó khăn rất lớn.

Hiện nay, trong sự bùng nổ của AI 0.0, một đặc điểm đáng kể là "phân cực": các lĩnh vực nóng nhất tập trung ở lớp mô hình lớn và lớp ứng dụng, trong khi lớp giữa tương tự như AI Infra có khoảng cách phát triển lớn, điều này cũng có thể chứa đựng cơ hội lớn tiếp theo. Nó giống như một kho báu chưa được khai thác đang chờ được các nhà thám hiểm khám phá và khai quật.

Bán xẻng không dễ và đào vàng thậm chí còn khó hơn

Mặc dù có tiềm năng kinh doanh rất lớn trong lớp AI Infra với sự bùng nổ của các ứng dụng mô hình lớn, nhưng đối với các công ty tham gia vào AI Infra, dù có mạnh trong lĩnh vực chuyên nghiệp nhưng họ vẫn tương đối dễ bị tổn thương khi đối mặt với những thay đổi của thị trường.

Sau 20 năm phát triển, hệ sinh thái CUDA của NVIDIA thường là hệ sinh thái đầu tiên chạy trên nền tảng CUDA cho các mô hình và ứng dụng tiên tiến nhất trong lĩnh vực AI.

Vì có các giao diện khác nhau giữa các phần cứng khác nhau, CUDA thống nhất ngôn ngữ của các giao diện này, cho phép người dùng vận hành các phần cứng khác nhau bằng ngôn ngữ tiêu chuẩn. Trong quá trình phát triển mô hình, các nhà phát triển thường có xu hướng hoàn thành công việc phát triển dưới cùng một hệ thống ngôn ngữ, điều này thực sự xây dựng nền tảng sâu sắc cho hệ sinh thái CUDA của NVIDIA.

Hiện tại, hệ sinh thái CUDA chiếm hơn 80% thị trường sức mạnh tính toán AI. Tuy nhiên, với sự tiến bộ của quá trình tiêu chuẩn hóa các mô hình AI, sự khác biệt về cấu trúc giữa các mô hình dần được giảm bớt, và không còn cần phải thường xuyên lên lịch nhiều mô hình lớn nhỏ, và những lợi thế của hệ sinh thái CUDA của NVIDIA đã bị suy yếu ở một mức độ nhất định. Mặc dù vậy, sự thống trị của NVIDIA trên thị trường sức mạnh tính toán vẫn khó lay chuyển. Theo dự đoán của ngành, trong 0-0 năm tới, NVIDIA vẫn sẽ là đơn vị dẫn đầu tuyệt đối trong toàn bộ nhà cung cấp phần cứng AI và thị phần dự kiến sẽ không dưới 0%.

Đối với các nhà cung cấp lớp AI Infra, có những "thợ đào" như NVIDIA bên ngoài, giống như bán vé, xẻng ở cổng mỏ vàng, cuối cùng tìm cách vào mỏ vàng, chỉ phát hiện ra những "thợ đào" bên trong từ lâu đã quen với việc khai thác "tự do" và không chấp nhận các công cụ mới.

Từ góc độ mô hình kinh doanh, một số nhà cung cấp AI Infra áp dụng mô hình kinh doanh dựa trên đăng ký, tính phí dựa trên lượng sức mạnh tính toán mà doanh nghiệp sử dụng, số lượng cuộc gọi mô hình hoặc việc sử dụng các mô-đun chức năng. Mô hình này tương tự như SaaS, trong đó doanh nghiệp không cần đầu tư một số tiền lớn vào phần cứng và phần mềm cùng một lúc, và chỉ cần thanh toán theo mức sử dụng thực tế, điều này làm giảm đáng kể ngưỡng để doanh nghiệp sử dụng AI Infra.

Ví dụ, một số nền tảng đã tung ra gói kết hợp "gói sức mạnh tính toán cơ bản + công cụ thuật toán nâng cao", và các doanh nghiệp vừa và nhỏ chỉ cần trả hàng nghìn nhân dân tệ mỗi tháng để sử dụng hàng triệu tài nguyên tính toán và các công cụ thuật toán tiên tiến để phát triển và áp dụng các mô hình lớn.

Đối với các doanh nghiệp lớn và người dùng trong các ngành cụ thể, họ thường có nhu cầu kinh doanh phức tạp và yêu cầu kỹ thuật đặc biệt, các sản phẩm AI Infra nói chung khó đáp ứng được nhu cầu của họ. Do đó, một số nhà cung cấp cung cấp các giải pháp AI Infra tùy chỉnh để cung cấp cho doanh nghiệp các dịch vụ đầy đủ quy trình từ xây dựng cụm sức mạnh tính toán, tối ưu hóa mô hình và triển khai ứng dụng.

Để thúc đẩy sự phát triển và ứng dụng của công nghệ, một số nhà cung cấp cơ sở hạ tầng AI sử dụng công nghệ mã nguồn mở và API mở để thu hút các nhà phát triển và doanh nghiệp xây dựng hệ sinh thái. Các framework mã nguồn mở PyTorch và TensorFlow là những ví dụ thành công, liên tục tối ưu hóa hiệu suất thông qua sự hợp tác cộng đồng, thu hút một lượng lớn các nhà phát triển từ khắp nơi trên thế giới đóng góp mã, hình thành một cộng đồng nhà phát triển lớn.

Mô hình đồng xây dựng sinh thái này không chỉ đẩy nhanh quá trình lặp lại và đổi mới công nghệ mà còn đạt được giá trị kinh doanh thông qua ảnh hưởng sinh thái. Các nhà sản xuất có thể kiếm tiền bằng cách cung cấp hỗ trợ kỹ thuật, dịch vụ đào tạo, v.v., đồng thời cung cấp nền tảng cho các nhà phát triển và doanh nghiệp giao tiếp và hợp tác, đồng thời thúc đẩy sự phát triển của toàn ngành.

Tại thị trường trong nước, các doanh nghiệp tương đối ít sẵn sàng trả tiền cho phần mềm và dịch vụ, và có xu hướng mua thiết bị phần cứng cùng một lúc hoặc phát triển các giải pháp của riêng họ. Các nhà cung cấp AI Infra cần chứng minh cho doanh nghiệp thấy rằng việc sử dụng các sản phẩm và dịch vụ AI Infra có thể mang lại giá trị thực sự như tiết kiệm chi phí và nâng cao hiệu quả thông qua các trường hợp và dữ liệu thực tế, để nâng cao khả năng thanh toán của doanh nghiệp.

Người dùng cũng phải đối mặt với "lo lắng về sự lựa chọn" khi lựa chọn các sản phẩm, dịch vụ của AI Infra, và không biết cách chọn sản phẩm phù hợp với mình. Do đó, bắt buộc phải xây dựng một nền tảng sinh thái AI Infra mở, chia sẻ và hợp tác. Chính phủ, doanh nghiệp và các tổ chức công nghiệp có thể làm việc cùng nhau để thúc đẩy các nhà sản xuất lớn mở rộng một số năng lực kỹ thuật của họ, khuyến khích các doanh nghiệp vừa và nhỏ tập trung vào đổi mới trong các lĩnh vực được chia nhỏ và cung cấp cho người dùng các giải pháp một cửa thuận tiện và hiệu quả hơn.

Ngoài ra, cũng cần tiếp tục khám phá các mô hình lợi nhuận đa dạng, ngoài các dịch vụ đăng ký và giải pháp tùy chỉnh, bạn cũng có thể cân nhắc hợp tác với các nhà sản xuất phần cứng để gói bán hàng và cung cấp các dịch vụ giá trị gia tăng để mở rộng lộ trình thương mại hóa.

Khi ai cũng đuổi theo gió, thường là những người âm thầm đánh bóng các công cụ mới thực sự quyết định mô hình ngành. Trong thời đại thay đổi này, AI Infra như một mảnh đất màu mỡ cần được vun trồng, không chỉ là "chặng cuối" triển khai công nghệ mà còn là "động lực đầu tiên" của việc nâng cấp công nghiệp.

Bất chấp nhiều thách thức về công nghệ, thị trường và sinh thái, với sự cải thiện tiêu chuẩn, sự trưởng thành của công nghệ và sự thịnh vượng của hệ sinh thái, AI Infra cuối cùng sẽ trở thành lực lượng cốt lõi thúc đẩy kỷ nguyên thông minh.

Đối với các doanh nghiệp và nhà phát triển, chỉ bằng cách xây dựng một hệ sinh thái mở và đôi bên cùng có lợi, đồng thời nuôi dưỡng mô hình chuyên môn hóa và phân công lao động công nghiệp chúng ta mới có thể thực sự hiện thực hóa tầm nhìn "làm cho các ứng dụng trở nên đơn giản hơn và AI thuận tiện hơn". Cuộc cách mạng công nghệ liên quan đến tương lai này không chỉ đòi hỏi sức mạnh kỹ thuật cốt lõi mà còn đòi hỏi tầm nhìn chiến lược hướng tới tương lai và trí tuệ của việc đồng xây dựng sinh thái.

Cơn sốt vàng cuối cùng sẽ giảm xuống, nhưng sẽ không bao giờ thiếu cơ hội cho những người xây đường.