很多企业在做 ERP/数字化时会遇到一个现实:数据越多,非结构化内容也越多(文档、图片、语音、工单),但真正能被业务用起来的却有限。近期 Google Cloud 介绍了把 Gemini/Vertex AI 能力更“原生”地集成进 BigQuery 的一组 AI 函数,让数据团队可以用 SQL 完成摘要、提取、翻译、结构化输出、向量化与相似度检索等任务。这类思路对企业数据平台很有启发:把 AI 变成数据层的标准函数,而不是散落在各种脚本和应用里。
这件事对 ERP/数字化有什么价值?
- 降低门槛:业务分析人员在熟悉的 SQL 里直接调用 AI,而不是去学一套新工具链。
- 让非结构化数据“可计算”:把文本/图像理解、结构化抽取变成表字段和指标,能进入报表、风控、供应链预测等流程。
- 更容易治理:当 AI 调用变成数据平台的一部分,权限、审计、成本核算更容易纳入企业治理体系。
可落地的 3 个用法(建议你们先从这里试)
- 工单/合同摘要 + 结构化字段:把长文本变成固定字段(客户、金额、风险点、交付日期),直接落表。
- 相似问题检索(语义检索):用 embedding + similarity / 向量检索快速找到“类似工单/类似故障/类似条款”。
- 多任务一次生成:一次 SQL 调用同时做实体抽取、情绪/风险判定、翻译、总结,输出多列结果,直接进入数据管道。
实施注意点(别踩坑)
- 权限与合规:把“谁能调用、能调用哪些模型、哪些数据可被模型看到”作为一等公民设计。
- 成本与缓存:优先对高价值场景做批处理/增量更新;不要把所有查询都实时调用大模型。
- 质量评测:为摘要/抽取建立抽样验收机制;关键字段要能回溯原文证据。
参考来源
本文观点基于公开资料二次整理与扩写,建议阅读原文了解细节:
Google Cloud Blog: New BigQuery gen AI functions for better data analysis
