Scan2AI是一个先进的Chrome扩展,用户可以捕捉屏幕的任意区域并将其发送到强大的AI API进行即时处理和洞察。
这款专业翻译扩展完美解决了Google Chrome中的翻译问题,提供比百度翻译、有道翻译和火山翻译更强大的翻译功能。它包括整页翻译、选词翻译、PDF翻译、Deepl集成、学术文档翻译、词典定义、图像翻译、截图翻译、在线翻译、Google翻译和翻译发音等多种功能。
WordScope Translate是一款革命性的AI翻译工具,通过极其用户友好的界面,利用先进的人工智能和光学字符识别(OCR)技术,提供无缝、即时的翻译服务。
图像转AI语音是一个网站,用户可以将图像文件(如jpg、png、jpeg等)转换为文本。用户只需注册或登录,上传图像文件,系统便会将其转换为可编辑的文本,随后可以下载或复制转换后的文本。
PlotChat是一个可以通过上传带有图表和可视化数据的图像,与数据进行对话的工具。用户可以提出问题,PlotChat将根据图像生成数据表,并提供额外的解释。
MacCopilot是一款为macOS用户设计的本地助手应用,能够智能互动屏幕内容,结合先进的AI模型如GPT-4和Gemini,旨在提升用户的生产力和创造力。用户可以灵活捕捉屏幕截图,与AI进行深入对话,并将内容导出为Markdown格式,方便分享和使用。
remove cand 是一个利用人工智能技术自动去除图像背景的网站,用户只需上传图像即可完成背景移除,适用于多种场景。
一个利用代理框架进行视觉任务的库,能够快速生成代码,帮助用户完成图像识别任务,简化视觉问题的解决过程。
Ferret-UI是一个能够理解移动UI的多模态大型语言模型(MLLM),支持根据用户指令执行各种开放任务,旨在增强对移动UI屏幕的理解。
Browser-Use 是一个开源的网页自动化库,能够让大型语言模型(LLM)与网站进行互动,通过简单的接口实现网页自动化操作,支持多标签管理、XPath提取和视觉模型处理。它兼容任意 LLM,适用于多种浏览器的自动化操作,可用于数据抓取和信息检索。
Klart AI是一个为企业设计的AI助手,能够无缝连接数据库,并与Slack和Teams平台集成。它增强了团队协作,自动化任务,并提供轻松访问关键信息的能力,从而提高团队效率。
一个安全的AI计算机使用项目,旨在通过 E2B 桌面沙盒安全地使用AI进行计算机操作。
ocrmac 是一个用于从 Mac 系统上的图像中提取文本的 Python 封装库,利用 Apple 系统的视觉框架,能够高效地识别并提取图像中的文本内容。该库专为 macOS 10.15 及以上版本设计,能够提供文本的置信度和边框信息,方便开发者在应用程序中集成 OCR 功能。
SketchEdge 是一款基于AI的工具,从照片或图像中提取线条画,准确捕捉轮廓,并应用类人柔软线条,提供与传统真实线条画提取不同的独特体验。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型