Eroale是一个集成多种人工智能功能的平台,提供AI聊天、视觉识别、图像聊天、PDF聊天、内容重写、博客创作向导等服务,并包含超过72个预制模板,支持Dall-E3、Stable、文本转语音、语音转文本、AI抄袭检测、代码生成等功能。
PatchDCT是用于高质量实例分割的补丁细化技术,旨在提高图像分割的精度和效果。该项目利用补丁细化方法,增强了实例分割的性能,适用于多种图像处理任务。
CAST项目旨在通过图像分割和识别技术,实现层次化的图像处理,提升对象识别的能力。
一种通过注意力重排列实现零样式迁移的方法,无需针对每种样式的训练数据。
基于飞桨的跨模态大模型开发套件,聚合图像、文本、视频等多种模态,覆盖视觉语言预训练,文生图,文生视频等丰富的跨模态任务。提供开箱即用的开发体验,同时满足开发者灵活定制需求,探索通用人工智能。
LC-FDNet是一个利用频率分解网络进行无损图像压缩的项目,具有高效的压缩性能,能够在不损失图像质量的情况下大幅度减少图像文件的大小。该项目旨在优化存储和传输大规模图像数据的效率,适合需要高质量图像处理的应用场景。
《TensorFlow in Action》教你使用TensorFlow 2构建、训练和部署深度学习模型,涵盖从DL基础知识到NLP、图像处理和MLOps的高级应用。
OminiControl是一个基于FLUX模型的通用扩散模型控制框架,支持主体驱动控制和空间控制,包括边缘引导和图像修复等功能,设计极简,增强了图像处理的灵活性和效果。
隐式非线性扩散模型的最大似然训练,旨在通过学习复杂数据分布来提升生成模型的性能。
ReplaceAnything是一款能够准确保留指定物体,并通过输入提示词,实现超高质量内容替换的工具。它支持多种场景应用,适用于商用场景如AI模特、商品宣传图和艺术写真照。
提供了 ComfyUI 的 BiRefNet 插件,支持多种预训练模型的使用,包括通用、人像、图像分割等场景的模型,并且支持自动下载模型文件。
Raspberry Pi Camera 是一款专为 Raspberry Pi 设计的摄像头模块,支持多种分辨率和帧率,可以拍摄静态图像和视频,并且能够实时传输视频流。它还具备夜视功能(需要额外配件),并且可以与多种编程语言和库进行集成,适合各种项目和应用。
这个项目收集了很多使用OpenAI Vision API来对图像、视频文件和网络摄像头流进行推理的示例。项目结合了多种技术,实现了高效的图像处理和准确标注,适合开发者和研究人员进行实验和学习。
taco(张量代数编译器)用于对稀疏和密集张量进行高效的张量表达式计算,支持优化计算性能,适用于多种应用场景。
remove cand 是一个利用人工智能技术自动去除图像背景的网站,用户只需上传图像即可完成背景移除,适用于多种场景。
一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、超分辨率、图片上色的全能型 APP。
GIMP的OpenVINO™ AI插件,功能包括超分辨率、风格迁移、修补、语义分割和Stable-Diffusion等,帮助用户提升图像处理能力,创造出更具艺术感的作品。
InstructPix2Pix是一个开源项目,可以利用AI根据文本指令对图像进行修改。它融合了GPT-3和Stable Diffusion/Prompt-to-Prompt技术,可以实现高质量的图像修改效果。
Background Remover是一个开源的命令行工具,利用AI技术,可以快速移除图像和视频中的背景。它使用了u2net这个开源的目标检测算法作为底层技术。
一个由SOTA AI模型驱动的免费开源图像清理工具,帮助你擦除图片中你不想要的内容,移除背景、面部修复等工作。
Designify是一款基于人工智能的设计工具,用户可以将任何照片转化为出色的设计。它提供了图像背景去除、色彩增强、智能阴影调整等功能。用户只需上传或粘贴图片,该工具便会自动创建惊艳的设计,用户可以保存、下载或分享他们的设计。
SnapGPT是一个智能文本识别应用,结合了友好的聊天助手功能,能够轻松从图像和文档中提取文本,并利用先进的GPT-3技术回答与文本相关的问题,同时提供文本转图像和语音转文本等功能,以提高工作效率。
Pixelcut是一个为在线商店和广告活动增强视觉内容而设计的多功能、用户友好的AI驱动在线设计工具。它主要用于简化和自动化创建高质量产品照片、吸引人的广告和其他对数字市场至关重要的视觉资产的过程。