Lũ quét hàng năm cướp đi sinh mạng của hàng nghìn người. Chúng xảy ra nhanh, tấn công các thành phố dữ dội nhất, và trong nhiều thập kỷ gần như không có gì các nhà khoa học có thể làm để dự đoán trước, vì dữ liệu để huấn luyện các mô hình dự đoán đơn giản không tồn tại. Vào thứ Năm, Google cho biết họ đã tìm ra cách vượt qua vấn đề đó—bằng cách đọc tin tức. Công ty giới thiệu Groundsource, một hệ thống sử dụng AI Gemini để quét qua hàng triệu bài báo đăng từ năm 2000, rút ra các tham chiếu về các sự kiện lũ lụt, và gắn mỗi sự kiện với một vị trí và ngày tháng. Kết quả là một bộ dữ liệu gồm 2,6 triệu trận lũ quét lịch sử trải dài hơn 150 quốc gia, và hiện mở cho bất kỳ ai tải xuống và sử dụng.
Bộ dữ liệu này sau đó được dùng để huấn luyện một mô hình AI mới có khả năng dự báo liệu lũ quét có thể xảy ra trong khu vực đô thị trong 24 giờ tới hay không. Các dự báo hiện đã có trên Flood Hub của Google, cùng nền tảng mà công ty đã sử dụng để cảnh báo khoảng 2 tỷ người về lũ lụt liên quan đến sông trên toàn thế giới. Vấn đề mà Groundsource giải quyết khá đơn giản. Các sông có các thiết bị đo đạc vật lý—các cảm biến nằm trong nước đã ghi lại mức độ trong nhiều thập kỷ. Đó là cách các dự báo học cách dự đoán khi nào sông sẽ tràn. Các con đường trong thành phố không có thiết bị như vậy. Khi mưa lớn trút xuống mặt đường và làm quá tải hệ thống thoát nước, lũ xảy ra quá nhanh và quá cục bộ để theo dõi bằng các thiết bị truyền thống. Không có hồ sơ lịch sử, bạn không thể huấn luyện một mô hình AI để nhận diện mẫu. Giải pháp của Google là xem các bài báo tin tức như cảm biến bị thiếu đó.
“Bằng cách biến thông tin công cộng thành dữ liệu có thể hành động, chúng tôi không chỉ phân tích quá khứ—chúng tôi đang xây dựng một tương lai bền vững hơn cho tất cả mọi người nhằm mục tiêu không ai bị bất ngờ bởi thảm họa tự nhiên,” Google nói.
Nguồn: Google
Sau khi lọc bỏ quảng cáo, menu điều hướng, trùng lặp, và dịch các bài viết từ các ngôn ngữ khác sang tiếng Anh, nhóm đã biến hàng triệu mô tả văn bản lộn xộn thành dữ liệu chuỗi thời gian sạch, có định vị địa lý. Mô hình huấn luyện dựa trên dữ liệu đó sử dụng mạng nơ-ron LSTM—một loại AI được xây dựng để xử lý các chuỗi theo thời gian—để tiếp nhận dự báo thời tiết hàng giờ cùng các yếu tố địa phương như mật độ đô thị, tỷ lệ thấm đất, và địa hình. Sau đó, nó đưa ra một tín hiệu đơn giản: nguy cơ lũ trung bình hoặc cao trong 24 giờ tới, cho bất kỳ khu vực đô thị nào có mật độ dân số trên 100 người trên km². Hệ thống này có những hạn chế thực tế. Nó chỉ bao phủ khoảng 20 km² mỗi lần, không thể dự đoán mức độ nghiêm trọng của lũ, và sẽ không hoạt động tốt ở những khu vực ít có tin tức. Tuy nhiên, kết quả ban đầu rất đáng chú ý. Một cơ quan phòng chống thảm họa khu vực ở miền Nam châu Phi đã nhận được cảnh báo từ Flood Hub trong giai đoạn thử nghiệm, xác nhận có lũ lụt thực tế, và cử một nhân viên nhân đạo để xử lý phản ứng. Theo giám đốc ứng phó khủng hoảng của Google, Juliet Rothenberg, “chuỗi sự kiện từ dự đoán trong Flood Hub đến hiện trường là chính xác mục đích mà Flood Hub được xây dựng.”