基于YOLOv7的车牌检测与识别,包括中文车牌识别,支持双层车牌和13种中文车牌类型。
InfraVisN AI利用可扩展的神经网络技术,重新定义基础设施管理,确保精确的缺陷检测和维护效率。该平台专为增长而设计,可以适应不断变化的需求,为智能和可扩展的检查设定了新的标准。
OpenALPR是由Rekor Systems, Inc.开发的一套专注于车牌和车辆识别技术的解决方案,旨在增强几乎任何IP摄像头、交通摄像头或安全摄像头的功能。
audio2text是一个由OpenAI驱动的服务,能够高精度地将音频文件转换为文本,支持多种语言和音频格式,并提供不同格式的转录文件下载选项。
april-asr是一个用C语言开发的语音转文本(STT)库,具备高效的语音识别算法和实时转录功能,支持多种语言,具有可扩展的架构,便于集成到其他项目中,适用于多种应用场景。
DenoLyrics是一个基于AI模型的网络应用,支持143种语言,提供音频转录、字幕、文本摘要和多语言翻译。它使用大型模型Whisper进行实时语音识别。
Speedy Audios是一个便捷的工具,用户可以通过将WhatsApp中收到的音频消息转发给Speedy Audios机器人,快速获取文本版本。该项目旨在帮助用户在几秒钟内处理长时间的音频信息,提升交流效率。
Shownotes是一个前沿的AI工具,利用Whisper技术进行音频转录,结合ChatGPT进行讨论总结,支持多种语言和格式,适用于内容创作者、播客和专业人士。
Whisper Turbo 是 Open AI 开源的一个新型 Whisper turbo 模型,基于 Large v3 模型的蒸馏,显著提高了运行速度和效率。该模型在保持高准确度的同时,提供了更佳的显存使用效率,适用于多种音频处理任务。
WAAS(Whisper as a Service)是基于OpenAI的Whisper自动语音识别(ASR)系统开发的一种创新AI工具,旨在提供一个全面的解决方案,将口语转换成文本。通过提供图形用户界面(GUI)和应用程序编程接口(API),WAAS能够满足各种用户的需求,无论是偏好交互式视觉工具的用户,还是希望将Whisper的能力整合到自己应用中的开发者。
TranscribeMe是一个平台,可以将WhatsApp和Telegram中的语音笔记转换为文本。用户只需将TranscribeMe机器人添加到联系人中,然后将音频消息转发给它,即可免费将其转换为文本。使用TranscribeMe非常简单,无需额外下载应用或提供个人信息。
Open-Lyrics是一个可以将音频转录为文本并翻译为LRC格式文件的工具,使用先进的whisper和gpt技术,支持多种语言,方便用户生成音乐字幕。
GoWhisper 是一款跨平台桌面应用,旨在提供流畅且安全的音频转录服务。用户可以选择所需语言和模型大小,轻松拖放或上传音频文件,并以所需格式(srt、txt、vtt、csv)导出转录文本。
Voice Vault 是一个基于 WhatsApp 的服务,可以将语音备忘录转录为文本,方便用户访问、搜索、总结和分享语音笔记。它提供两种定价计划(基础和高级),支持多种音频格式和语言。
Word Express 是一款由 Gravity Storm Software 开发的桌面应用程序,基于 GPT 语言模型,能够进行语音转文字、翻译、文本生成等多种自然语言处理任务。User-friendly 的界面支持多语言音频文件转录,实时文本记录和人性化文本生成,广泛适用于内容创作、客户服务等场景。
Whisper API是一个强大的AI驱动的转录工具,利用OpenAI的Whisper模型,为音频文件提供准确可靠的转录服务。用户可以轻松地将Whisper的转录功能集成到他们的应用、服务或工作流程中。
Vscoped是一项先进的AI驱动视频转录服务,能够快速准确地转录TikTok、YouTube短视频和长格式视频,提升用户体验,增加内容的可及性和吸引力。该工具提供多种功能,使转录过程无缝高效,满足内容创作者、营销人员和个人用户的需求。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型