中证网
返回首页

海天瑞声宣布开放多模态数据集 助力数字中国建设

王珞 中国证券报·中证网

  中证网讯(王珞)作为中国科技创新领域的重要盛会,以及科技企业实力和形象展示的重要舞台,2023年度的中关村论坛于近日在北京开幕。AI训练数据龙头服务商海天瑞声CEO王晓东受邀出席其中的分论坛——人工智能开放生态建设论坛,并发表了题为《共享开放数据助力数字中国建设》的演讲,宣布海天瑞声将开放多模态数据集。   

  开源数据集 助力AI开放生态构建

  据了解,本届中关村论坛的主题是“开放合作·共享未来”。开放生态是全球人工智能发展的大势所趋,尤其是AI算法的优化和模型的训练需要足够优质和丰富的数据集支持,因此共享数据集就成为AI开放生态系统中非常关键的一环,对行业的推动作用也变得至关重要。   

  海天瑞声CEO王晓东在论坛上发表演讲 图片来源:公司提供

  海天瑞声CEO王晓东表示,作为AI数据行业里首家上市公司,海天瑞声天然肩负着开源开放、推进数据资源整合共享的社会责任。此次即将开源的多模态数据集「DOTS-MM-0526」涵盖图像、语音、文本等多个维度。海天瑞声希冀与全球AI开发者和研究人员建立更加紧密的合作关系,共同推动人工智能技术的发展和应用。同时,开源数据集计划亦是公司对于AI开放生态的一次有益尝试,是公司在数据智能化应用领域持续发力的体现。

   品牌焕新展现海天瑞声战略新布局

  在论坛上,王晓东还隆重发布了海天瑞声企业品牌焕新战略:公司将启用全新Logo,英文名称将从“SpeechOcean”改成“DataOcean AI”,中文名“海天瑞声”不变。

  王晓东表示:“此次品牌升级不仅是一个简单的改名,它还代表着海天瑞声将在数据科技和人工智能领域的进一步发展和探索。”

  他进一步阐述道,海天瑞声因优质海量的智能语音数据被大家所熟知,但近些年来随着人工智能技术的不断迭代与发展,海天瑞声的业务已从单纯的语音领域服务,扩展至提供覆盖语音、计算机视觉、自然语言处理和多模态的数据解决方案及成品数据集,未来还将支持以数据驱动的生成式AI业务发展。

  显然海天瑞声早已不再局限于“语音Speech”而是更广阔的“数据Data”海洋。为更好地反映公司的业务范围和技术实力,海天瑞声对企业品牌进行了升级,以更好地满足客户全方位需求。

  而品牌升级背后,海天瑞声全新的战略布局也逐渐清晰呈现。

  据了解,自2005年成立以来,海天瑞声就一直在为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。

  目前这些数据集已覆盖智能语音、计算机视觉、自然语言等AI核心领域。经过多年深耕,海天瑞声的产品和服务已获得阿里巴巴、腾讯、三星等国内外头部客户的认可,并在自动驾驶、虚拟主播、声纹识别、人脸姿态等众多人工智能场景及相关算法模型的训练过程中获得应用。

  深入布局自动驾驶领域 开发全栈式自动驾驶数据平台

  据海天瑞声介绍,自动驾驶领域是公司着重进行业务布局和彰显技术实力的核心领域之一。4月18日,海天瑞声正式推出“DOTS-AD自动驾驶平台”。

  论坛期间,海天瑞声CTO黄宇凯介绍,这是一款专为自动驾驶场景设计的全栈式数据平台,能够支持多维度、全方位的自动驾驶标注任务,数据标注效率提升高达8倍。支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化部署。

  该平台的四大具有核心功能:一是全面支持自动驾驶领域各维度2D/3D/4D点云或图像数据标注;二是能针对不同场景支持辅助标注/自动化标注;三是支持项目的柔性管理,支持流程/工具/标签的自定义;四是可实现对数据的智能化管理,确保客户的商业敏感数据安全合规。基于这些核心功能,海天瑞声正建立起在智能驾驶数据训练领域的核心壁垒,也将赋能自动驾驶技术迈向新高度。

中证网声明:凡本网注明“来源:中国证券报·中证网”的所有作品,版权均属于中国证券报、中证网。中国证券报·中证网与作品作者联合声明,任何组织未经中国证券报、中证网以及作者书面授权不得转载、摘编或利用其它方式使用上述作品。