谷歌AI团队取得一项突破性进展,他们将人工智能与历史新闻报道相结合,开发出一种预测致命山洪的新系统。通过分析数百万篇旧新闻报道,谷歌的研究人员成功训练出AI模型,创建了一个独特的数据基础,有望彻底改变全球数据稀缺地区的预警系统。

这项创新方法于本周公开发布,标志着大型语言模型在解决关键地球物理数据缺口方面迈出了重要一步。
**谷歌AI应对山洪预测挑战**
山洪是破坏性最大的自然灾害之一,据全球气象组织统计,每年造成5000多人死亡。山洪暴发突然,影响范围高度局部化,因此,长期以来,精确预测山洪一直非常困难。传统的的天气模型擅长追踪飓风等大规模天气系统,或监测河流的长期水位。然而,它们往往无法捕捉到在几分钟或几小时内引发灾难性山洪的快速地面情况。
谷歌的研究团队认为,根本问题在于数据稀缺。Upstream Tech是一家专门从事水文预报的公司,其首席执行官Marshall Moutenot解释说:“数据稀缺是地球物理学中最严峻的挑战之一。同时,地球数据又太多了,而当你想要根据事实进行评估时,数据又不够。”为了弥合这一差距,谷歌另辟蹊径,从全球新闻档案中寻找数据。
**Gemini如何从新闻中挖掘洪水数据**
该团队利用了谷歌的Gemini大型语言模型的力量,对全球新闻文章进行了梳理,寻找与过去发生的山洪事件相关的描述。然后,他们将这些文本报告转化为结构化数据集,称为Groundsource。每条记录都包含事件发生的位置、日期、人员伤亡和破坏程度等关键细节。
**技术架构:从文本到预测**
在建立了Groundsource作为历史事实集之后,谷歌的工程师构建了一个复杂的预测管道。他们训练了一个长短期记忆(LSTM)神经网络——一种擅长识别顺序数据模式的模型——来接收实时的全球天气预报。该模型将这些实时大气数据与从Groundsource中学习到的历史模式相关联,最终生成任何给定区域发生山洪风险的概率评分。
**实际影响和当前局限性**
这种AI驱动的方法是专门为缺乏先进基础设施的地区的可扩展性而设计的。许多政府无力负担密集的的天气雷达或河流流量计网络。谷歌的模型提供了一种可行的数据驱动替代方案,它利用现有的全球天气预报和新挖掘的历史记录。
谷歌AI模型的关键优势:
* **成本效益:** 无需昂贵的基础设施投资
* **全球可扩展性:** 可应用于任何有新闻档案的地区
* **快速部署:** 可以相对快速地实施,以改善预警系统
**AI与环境预测的未来**
谷歌的这个项目预示着AI在应对环境挑战方面的应用将发生转变。该团队认为,使用LLM将定性书面报告转化为定量数据集的方法具有广泛的适用性。“该团队希望使用LLM开发定量数据集

