Eternity AI是印度理工学院帕特纳分校的一个研究项目,旨在构建一个以人为本的语言模型,能够通过访问实时互联网来模拟人类行为,减少幻觉,并在超过10万个行为参数上进行训练。
Agents是一个开源的自主语言Agent框架,支持长短期记忆、工具使用、网络导航、多agent通信等功能。此外,它还引入了人机交互和符号控制等新功能,旨在提供更加智能化的交互体验。
UI-TARS是一款能像人类一样与图形界面交互的Agent模型,通过视觉感知、推理和行动能力,自动完成各种任务,包括在电脑、手机或网页上操作软件,而无需人工编写规则。同时,它集成了所有关键组件,实现端到端任务自动化,支持本地和云端部署。
微软的文本转语音头像项目,允许用户通过文本输入创建会说话的头像视频,构建实时交互式机器人。
Linly-Talker是一个结合大型语言模型与视觉模型的数字人对话系统,通过集成多种先进技术,如Whisper、Linly、微软语音服务和SadTalker生成系统,创造全新的用户与AI助手的互动体验。该系统允许用户通过图像与AI进行对话,并支持自由对话和内容生成,极大地提升了人机交互的灵活性和趣味性。