Bản tin công nghệ
figonkingx  

Bản tin Công nghệ — 18/03/2026

Tổng hợp tin tức công nghệ nổi bật ngày 18/03/2026 — tuần của NVIDIA GTC, Vera Rubin, Meta sa thải 20%, và làn sóng đầu tư AI infrastructure.

Nội dung chính

🤖 AI & LLM

NVIDIA GTC 2026: Vera Rubin NVL72 + Groq 3 LPX — Jensen Huang công bố thế hệ GPU mới mạnh gấp 50x tokens/watt so với Blackwell H200. Kết hợp với Groq 3 LPX (chip inference chuyên dụng từ thương vụ mua lại Groq trị giá $17 tỷ), hệ thống đạt throughput cao hơn 35x/megawatt thông qua kiến trúc “disaggregated inference” — prefill trên Vera Rubin GPU, decode trên Groq LPU. NVIDIA kỳ vọng doanh thu $1 nghìn tỷ từ Blackwell + Vera Rubin đến 2027.

Fractal ra mắt LLM Studio — Nền tảng enterprise cho phép tổ chức Fortune 500 tùy chỉnh GenAI với NVIDIA NeMo và NIM Microservices. Demo tại GTC 2026. Xu hướng rõ ràng: enterprise muốn kiểm soát toàn bộ AI pipeline thay vì dùng model chung.

MiroMind phát hành MiroThinker-1.7 và MiroThinker-H1 — Model tập trung vào “verifiable reasoning” với kiến trúc xác minh từng bước suy luận, hướng tới độ chính xác cao cho lĩnh vực pháp lý và tài chính. Reasoning model đang phân hóa: không chỉ nhanh hơn mà phải chứng minh được từng bước.

D-ID V4 Expressive Visual Agent — Avatar AI ultra-high-fidelity kết nối real-time với LLM, digital human cho enterprise customer service.

Varonis ra mắt Atlas — Nền tảng giúp doanh nghiệp quản lý và bảo mật AI agents, copilots, LLMs. Theo báo cáo Pentera, 67% CISO hiện thiếu visibility về AI trong tổ chức — shadow AI là shadow IT thế hệ mới.

💻 Chip & Phần cứng

NVIDIA Vera Rubin NVL72 — Rack-scale system cho agentic AI. Google Cloud cam kết là cloud provider đầu tiên cung cấp từ H2/2026, tích hợp vào AI Hypercomputer architecture. Kiến trúc mới tách biệt inference: prefill (GPU) + decode (LPU).

NVIDIA Groq 3 LPU — Chip inference chuyên dụng tích hợp vào hệ sinh thái NVIDIA thông qua Dynamo framework. NVIDIA cũng ra mắt Vera CPU, nhắm thay thế Intel trong server. Jensen đang xây “full stack” thực sự — GPU, LPU, CPU, networking.

Frore Systems gọi $143M (định giá $1.64 tỷ) — Công nghệ cooling chip AI. Nhiệt độ, mật độ năng lượng, thiết kế rack đang là bottleneck quan trọng nhất của AI infrastructure. “Boring” tech nhưng critical.

DLSS 5 được công bố tại GTC — thế hệ upscaling mới cho gaming và professional visualization.

Kepler Communications triển khai hạ tầng computing phân tán trên vệ tinh powered by NVIDIA — cloud computing ngoài không gian đầu tiên.

🚀 Startup & Đầu tư

Nexthop AI — $500M Series B — AI networking infrastructure. Lightspeed dẫn đầu, a16z tham gia. Networking layer kết nối GPU cluster đang trở thành category đầu tư riêng — không chỉ GPU, mà cả network fabric cũng là bottleneck.

Quince — $500M, định giá $10.1 tỷ — AI-native e-commerce dùng AI tối ưu supply chain, pricing, demand prediction. Consumer AI unicorn đầu tiên ở mega-scale, chứng minh AI supply chain tạo đủ margin để xây brand $10B+.

Replit — định giá $9 tỷ (gấp 3 lần trong 6 tháng). Mục tiêu $1B ARR cuối 2026. “Vibe coding” — tạo app bằng ngôn ngữ tự nhiên — trở thành xu hướng thế hệ, xóa mờ ranh giới developer/non-developer.

Axiom — $200M Series B — Formal verification cho AI-generated code. Xác minh toán học rằng code AI tạo ra an toàn trước khi deploy. Giải quyết đúng pain point khi AI tạo code nhanh nhưng verify chậm.

Kai ($125M) cho agentic AI cybersecurity và Oro Labs ($100M) cho AI procurement (Goldman Sachs đồng dẫn đầu). Tổng tuần: $1.4B+ chảy vào trust, governance, operational layers — enterprise AI đang vào giai đoạn production.

🔒 Bảo mật

67% CISO thiếu AI visibility — Báo cáo Pentera 2026 cho thấy đa số CISO không biết AI đang chạy ở đâu trong tổ chức. Shadow AI đang tạo lỗ hổng bảo mật nghiêm trọng khi nhân viên sử dụng AI tools mà IT không kiểm soát.

IBM X-Force: Tấn công cloud đang nhắm vào hệ sinh thái (service providers, API keys, misconfigurations) thay vì brute-force infrastructure. Bảo mật cloud cần shift sang supply chain và identity management.

Hàn Quốc mở rộng hợp tác cybersecurity với NATO và Indo-Pacific partners. RSAC 2026 diễn ra tuần tới (23-26/3) tại San Francisco — sự kiện bảo mật lớn nhất năm với nhiều giải pháp AI security mới từ OpenText, Intel 471.

Bộ Năng lượng Mỹ (CESER) chuẩn bị kế hoạch chiến lược cybersecurity mới, triển khai National Cybersecurity Strategy cho hạ tầng năng lượng.

☁️ Cloud & Infra

Google Cloud sẽ là cloud provider đầu tiên cung cấp NVIDIA Vera Rubin NVL72 từ H2/2026, tích hợp vào AI Hypercomputer. Cloud race: ai có Vera Rubin trước sẽ hút khách enterprise AI.

84% tổ chức sẽ chạy AI trên hybrid on-premises/edge + cloud (IDC CIO Playbook 2026). Cloud-only AI đã hết thời — enterprise muốn kiểm soát data và latency.

NVIDIA Cloud Partners tăng gấp đôi AI factory footprint YoY — mở rộng sovereign AI tại Mỹ, Úc, Đức, Indonesia, Ấn Độ. Geopolitics đang định hình AI infrastructure.

KubeCon + CloudNativeCon Europe 2026 diễn ra 23-26/3 tại Amsterdam — sự kiện cloud-native lớn nhất châu Âu.

🛠️ Dev Tools & Open Source

Replit $9B — “Vibe coding” platform đang thay đổi cách developer làm việc. Ranh giới “developer” và “non-developer” đang mờ dần khi AI có thể viết code từ mô tả ngôn ngữ tự nhiên.

NVIDIA Dynamo — Framework mới kết nối Vera Rubin GPU với Groq 3 LPU cho disaggregated inference. Open ecosystem cho AI inference optimization.

OpenTofu vs Terraform tiếp tục là cuộc chiến IaC lớn nhất. Crossplane đang biến Kubernetes thành universal control plane cho mọi cloud resource. Open source IaC đang thắng sau HashiCorp license change.

🏢 Big Tech

Meta sa thải tới 20% (~15,800 người) để bù chi phí AI. Cổ phiếu tăng 3% sau tin. Đồng thời chi $2B mua startup AI Trung Quốc Manus. Nghịch lý 2026: sa thải người để trả tiền cho AI.

NVIDIA: Jensen Huang tuyên bố doanh thu chip AI đạt $1 nghìn tỷ đến 2027 (tăng từ $500B dự kiến). GTC 2026 diễn ra 16-19/3 tại San Jose — sự kiện AI lớn nhất năm. NVIDIA đang xây toàn bộ AI computing stack từ GPU đến CPU, LPU, networking.

Google đang mua hệ thống cooling datacenter từ Envicool (Trung Quốc) — nhu cầu cooling cho AI datacenter vượt xa supply.

Trẻ vị thành niên Tennessee kiện xAI vì Grok tạo hình ảnh tình dục. Vụ kiện có thể tạo tiền lệ quan trọng cho AI safety regulation và quản lý image generation models.

Big Tech mua carbon credits tăng vọt do AI race, Microsoft dẫn đầu. Tiêu thụ năng lượng cho AI đẩy carbon footprint lên cao kỷ lục.

💡 Nhận định tổng quan

① Disaggregated Inference là kiến trúc tương lai: Vera Rubin (prefill) + Groq 3 (decode) cho hiệu quả gấp 35x. Mọi cloud provider sẽ phải theo.

② AI funding đang chuyển từ “xây model” sang “xây infrastructure xung quanh model”: networking ($500M Nexthop), security ($125M Kai), verification ($200M Axiom). Dấu hiệu thị trường trưởng thành.

③ Meta sa thải 20% để fund AI là preview cho cả ngành: AI không miễn phí — ai đó phải trả giá, và thường là nhân viên hiện tại.

Comments

Leave A Comment