1)视频图像中的目标检测,分析与识别;
2)可用于MTV歌词分析,合法性审查、安全性审查的自然语言理解技术预研;结合自然语言大模型,语音识别与语音合成技术,可用于驱动虚拟人(虚拟DJ、虚拟主持人)的自然语言对话交互技术预研;
3)可用于指导音质优化、演唱智能推荐、智能VJ实时调光、音频质量分析、评估与优化的音乐音频大模型构建及音频特征分析技术预研。
更新时间:2023-04-03
所属领域
新一代信息技术项目类型
信息传输、计算机服务和软件业技术水平
国内领先合作方式
合作开发1)视频图像中的目标检测,分析与识别;
2)可用于MTV歌词分析,合法性审查、安全性审查的自然语言理解技术预研;结合自然语言大模型,语音识别与语音合成技术,可用于驱动虚拟人(虚拟DJ、虚拟主持人)的自然语言对话交互技术预研;
3)可用于指导音质优化、演唱智能推荐、智能VJ实时调光、音频质量分析、评估与优化的音乐音频大模型构建及音频特征分析技术预研。
全部评论