您的位置:首页 > 科技 > 能源 > 劳务派遣许可证_香港服务器浏览国外网站_微信公众号怎么创建_网站需要改进的地方

劳务派遣许可证_香港服务器浏览国外网站_微信公众号怎么创建_网站需要改进的地方

2025/8/5 19:46:24 来源:https://blog.csdn.net/hooksten/article/details/146220423  浏览:    关键词:劳务派遣许可证_香港服务器浏览国外网站_微信公众号怎么创建_网站需要改进的地方
劳务派遣许可证_香港服务器浏览国外网站_微信公众号怎么创建_网站需要改进的地方

开源的自动驾驶视觉语言模型标注数据集

收集了一些关于vlm的开源数据集,供参考

开源项目列表

项目名称描述链接
VLM-R1基于Qwen2.5-VL和R1强化学习技术的开源视觉语言模型,支持图像和文本的联合处理GitHub - VLM-R1
VLMEvalKit大型视觉语言模型的开源评估工具包,支持多种评估任务GitHub - VLMEvalKit
SmolVLM小巧、快速、内存高效的开源视觉语言模型,包含模型检查点、数据集和训练工具Hugging Face - SmolVLM
Molmo VLM开源视觉语言模型家族,适用于指向、计数、视觉问答等任务Learn OpenCV - Molmo VLM
VisionArena-Battle包含30K真实世界图像对话和偏好投票的标注数据集Hugging Face - VisionArena-Battle
LlavaGuard基于VLM的视觉保护框架,包含高质量人工标注的多模态安全数据集arXiv - LlavaGuard
VLFeedback开源的GPT-4V标注视觉语言偏好数据集,包含80K指令和多个大型视觉语言模型的响应VLFeedback
Touch-Vision-Language Dataset结合触觉、视觉和语言的多模态对齐数据集,包含43,741个图像-触觉对Touch-Vision-Language Dataset
Prometheus-Vision用于细粒度评估的视觉语言模型,模拟人类评估者和GPT-4V的反馈Prometheus-Vision
SAIL-VL通过高质量数据管理实现可扩展训练的开源视觉语言模型系列arXiv - SAIL-VL

以上是关于自动驾驶视觉语言模型标注数据集的开源项目列表,每个项目都提供了不同的功能和数据集,适用于不同的研究和应用场景。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com