利用视觉语言模型(VLMs)为图片自动生成描述的工具,具备自动检测并解决重复序列标题失败的功能,支持多种脚本和模型。该工具旨在提升图像描述的质量与多样性,适用于多种应用场景,如社交媒体、内容创作等。
简单图片重描述:一款利用vllm技术为大型网络数据集的图片自动生成描述并保存结果的工具,适用于图像生成社区,支持多GPU优化和水印检测。