把生成式AI直接塞进SQL:BigQuery AI 的低摩擦落地路径 很多企业在做 ERP/数字化时会遇到一个现实:数据越多,非结构化内容也越多(文档、图片、语音、工单),但真正能被业务用起来的却有限。近期 Google Cloud 介绍了把 Gemini/Vertex AI 能力更“原生”地集成进 BigQuery 的一组 AI 函数,让数据团队可以用 SQL 完成摘要、提取、翻译、结构化输出、向量化与相似度检索等任务。这类思路对企业数据平台很有启发:把 AI 变... BigQuery ERP GenAI 人工智能 数字化 数据平台
AI算力进入通信与带宽时代:MoE 推理瓶颈不再只是GPU 企业上 AI,最容易走偏的点之一是把问题简化成“买更多 GPU”。但当模型从标准 LLM 演进到 Mixture-of-Experts(MoE)架构,推理瓶颈开始从算力密度转向 通信延迟与内存带宽 。Google Cloud 分享了围绕 A4X(GB200 NVL72)与 NVIDIA Dynamo 的推理参考方案,强调把推理当成一个由 基础设施层、Serving 层、编排层 组成的系统工程。 对... AI基础设施 MoE 云计算 人工智能 推理 数字化