
乌克兰已选定谷歌的开源模型Gemma作为其国家大型语言模型的开发基础,此举标志着该国在军事和民用领域需求激增的背景下,朝着构建主权人工智能系统迈出了关键一步。该公告由基辅之星(Kyivstar)与乌克兰数字转型部WINWIN AI卓越中心于12月1日联合发布,旨在创建一种独立的人工智能能力,能够完全在乌克兰境内处理敏感的国家数据。
技术基础与战略选择
基辅之星将主导乌克兰大型语言模型的开发工作,初期将利用谷歌的Vertex AI基础设施进行训练,之后将完全迁移至本地基础设施。基辅之星数字产品开发总监米哈伊洛·内斯特尔表示:“为乌克兰大型语言模型选择Gemma,在性能与资源消耗之间取得了最佳平衡,同时也确保了高质量的训练效果。”该模型支持包括乌克兰语在内的超过140种语言,拥有高达128,000个标记的上下文窗口,并具备多模态能力。
数字转型部首席人工智能官丹尼洛·茨沃克指出,选择Gemma主要基于其现有对乌克兰语文本的良好处理能力,以及在额外训练过程中的可控性,这有助于“最大限度地降低语言和伦理风险”。该项目将改进乌克兰语的分词器,利用目前正在收集的独特乌克兰语文本对模型进行训练,并为未来的应用创建基准测试。
更广泛的数字化转型战略
这一举措是VEON集团在其运营市场弥合人工智能语言鸿沟的广泛战略的一部分。继2024年12月在哈萨克斯坦推出KazLLM以及在巴基斯坦启动乌尔都语大型语言模型项目之后,乌克兰大型语言模型成为VEON利用本地化相关人工智能赋能数字生态系统的下一步。VEON集团首席执行官卡安·泰尔齐奥卢表示:“我们有责任将增强智能的优势带给我们所服务的国家——通过不仅基于词汇,更基于本地语境训练的大型语言模型来实现。”
选择谷歌技术也强化了乌克兰与美国之间的技术和经济联系,这种联系因基辅之星于2025年8月在纳斯达克上市而进一步加深。基辅之星计划与VEON集团一起,在2023年至2027年间向乌克兰投资10亿美元。一旦完成,乌克兰大型语言模型预计将成为政府、医疗保健、教育和金融服务等领域人工智能驱动服务的基础。
