LangFair是一个Python库,旨在评估大型语言模型(LLM)在具体用例中的偏见和公平性。它提供超过20种评估指标,支持多种LLM用例,并配备自动化评估工具,简化了评估流程。
Eticas是一个专注于通过自动化审计和独特的数据库,系统性地消除AI系统中的意外偏见的项目。凭借十年的负责任AI经验,Eticas能够确保输出的有效性和合规性。
HireRight.AI利用人工智能技术优化招聘流程,自动评估候选人技能,了解招聘经理的需求,简化评估过程,帮助企业做出明智的招聘决策。
Bench是一个用于评估语言模型(LLM)在生产用例中的工具,支持多种语言模型的评估,并提供详细的评估报告和指标,易于集成到现有的生产环境中,且支持自定义评估用例。
医疗大语言模型综合评测框架,特点包括大规模综合性能评测、深入细分的多维度场景评估、创新性的开放式评估指标和自动化评估模型
rebuff是一个专门用于检测和防止大语言模型(LLM)注入攻击的工具,能够实时监控和分析输入数据,提供详细的安全报告和警告,支持多种语言模型的集成,确保应用程序的安全性。
Metaview是一款为招聘者和面试官设计的自动化AI生成笔记工具。它通过在每次面试后提供自动摘要来节省时间,减少手动工作。用户只需将Metaview与现有工具(如日历、ATS、GoodTime、Calendly或视频会议平台)集成,即可使用。Metaview能够捕捉面试过程,生成包含关键信息的AI驱动笔记,并提供可定制的候选人摘要,自动填写支持平台上的面试评分卡。
TextBuddy是一个创新的在线写作编辑器,旨在通过结合简单语言原则和AI技术,提高书面沟通的清晰度和简洁性。它为专业人士、学生以及希望改善写作效果的个人提供全面的功能,分析和优化文本,使其易于阅读和理解。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型