Google 正式公开预览 BigQuery 托管人工智能函数,将大型语言模型能力封装为 AI.IF、AI.CLASSIFY 和 AI.SCORE 三个函数,可直接嵌入 SQL 查询中。这让熟悉 SQL 的数据团队无需额外学习提示词工程或模型调用,即可在查询中处理语义分析任务。
SQL 是结构化数据分析的核心工具,但面对评论文本、新闻内容或图片等非结构化数据时,通常需要先将数据迁移至其他系统,再对接语言模型 API 并设计提示词。如今,Google 将常见的语义筛选、分类与评分需求整合为 BigQuery 内置函数,让数据分析师在原有环境中即可调用大型语言模型完成任务。
这组函数中,AI.IF 负责语义判断,用户可用自然语言描述条件,即使文本未明确提及关键词,BigQuery 也能识别并筛选出与特定主题相关的新闻或记录;AI.CLASSIFY 用于分类,用户提供一组标签后,系统可自动将文本或图像归类,便于后续统计分析;AI.SCORE 则为每条数据打分,依据自然语言描述的标准生成评分,可用于对影评、产品反馈等内容进行排序。
Google 在后台对这些人工智能函数进行了提示词优化与查询计划调优。例如,BigQuery 会优先执行常规 WHERE 条件过滤,再调用大型语言模型,从而减少模型调用次数和执行时间;系统还会自动选择最优的模型端点与参数配置,在保证结果稳定的同时控制成本。
这组托管人工智能函数是对现有 AI.GENERATE 等通用 Gemini 推理函数的补充。对于常见的语义筛选、分类或评分场景,官方建议优先使用 AI.IF、AI.CLASSIFY 和 AI.SCORE;若需更精细地控制提示词或指定特定模型,则可继续使用 AI.GENERATE 系列函数。Google 预告未来将把更多计算任务迁移至 BigQuery 端,在部分场景下实现显著的性能提升。这些函数已集成至 BigQuery DataFrames,并提供 Python 示例代码供开发者使用。