Lingshu-7B - 阿里巴巴 大型语言模型模型概述Lingshu-7B 是 阿里巴巴 公司于 2025 年 6月发布的大型语言模型,拥有 7B (also 32B variant available) 参数规模。 采用 MIT 开源许可证,允许商业使用和二次开发,为企业提供了极大的灵活性。 Lingshu-7B 在开源社区获得了广泛认可,Hugging Face 平台上的下载量已达到 N/A,获得了 N/A 个点赞,显示出强大的社区影响力和用户认可度。 Lingshu-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
7B (also ...
Qwen2.5-7B-Instruct - 阿里巴巴 大型语言模型
Qwen2.5-7B-Instruct - 阿里巴巴 大型语言模型模型概述Qwen2.5-7B-Instruct 是 阿里巴巴 公司于 2024 年 9月发布的大型语言模型,拥有 7B 参数规模。该模型经过指令微调,专门针对对话和任务执行场景进行了优化。 该模型支持多种语言,能够处理包括中文、英文在内的多语言任务,具备强大的逻辑推理和数学推理能力。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2.5-7B-Instruct 在开源社区获得了广泛认可,Hugging Face 平台上的下载量已达到 5.2M,获得了 816 个点赞,显示出强大的社区影响力和用户认可度。 在性能方面,支持 128K tokens 的超长上下文窗口。
核心特性
7B 参数规模:采用大规模参数设计,在性能和...
Qwen2-0.5B - Qwen2 0.5B ultra-lightweight model
Qwen2-0.5B - Qwen2 0.5B ultra-lightweight model模型概述Qwen2-0.5B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 0.5B 参数规模。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2-0.5B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
0.5B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
Apache 2.0 开源许可:完全商业友好,无使用限制,支持二次开发
完全开源...
Qwen2-72B - Qwen2 72B flagship model
Qwen2-72B - Qwen2 72B flagship model模型概述Qwen2-72B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 72B 参数规模。 Qwen2-72B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
72B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
同系列模型Qwen2-72B 属于 Qwen 系列模型。该系列通常包含多个不同规模的...
Qwen2-1.5B - Qwen2 1.5B lightweight model
Qwen2-1.5B - Qwen2 1.5B lightweight model模型概述Qwen2-1.5B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 1.5B 参数规模。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2-1.5B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
1.5B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
Apache 2.0 开源许可:完全商业友好,无使用限制,支持二次开发
完全开源:模型权重和...
Qwen2-7B - Qwen2 7B with improved 多语言支持 capabilities
Qwen2-7B - Qwen2 7B with improved 多语言支持 capabilities模型概述Qwen2-7B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 7B 参数规模。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
Apache 2.0 开源许可:完全商业友好,无使用限制,支持二次开发
完全开源:模型...
Qwen1.5-0.5B - Qwen1.5 0.5B ultra-lightweight model
Qwen1.5-0.5B - Qwen1.5 0.5B ultra-lightweight model模型概述Qwen1.5-0.5B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 0.5B 参数规模。 Qwen1.5-0.5B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
0.5B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
同系列模型Qwen1.5-0.5B 属...
Qwen1.5-72B - Qwen1.5 72B flagship model
Qwen1.5-72B - Qwen1.5 72B flagship model模型概述Qwen1.5-72B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 72B 参数规模。 Qwen1.5-72B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
72B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
同系列模型Qwen1.5-72B 属于 Qwen 系列模型。该系列通...
Qwen1.5-14B - Qwen1.5 14B model
Qwen1.5-14B - Qwen1.5 14B model模型概述Qwen1.5-14B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 14B 参数规模。 Qwen1.5-14B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
14B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
同系列模型Qwen1.5-14B 属于 Qwen 系列模型。该系列通常包含多个不同规模...
Qwen1.5-1.8B - Qwen1.5 1.8B lightweight model
Qwen1.5-1.8B - Qwen1.5 1.8B lightweight model模型概述Qwen1.5-1.8B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 1.8B 参数规模。 Qwen1.5-1.8B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
1.8B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
同系列模型Qwen1.5-1.8B 属于 Qwen...
Qwen1.5-7B - Qwen1.5 7B model with strong Chinese capabilities
Qwen1.5-7B - Qwen1.5 7B model with strong Chinese capabilities模型概述Qwen1.5-7B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 7B 参数规模。 Qwen1.5-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
同系列模型Qwen1.5-7B ...
VideoLLaMA3 7B - 阿里巴巴 大型语言模型
VideoLLaMA3 7B - 阿里巴巴 大型语言模型模型概述VideoLLaMA3 7B 是 阿里巴巴 公司于 2024 年 1月发布的大型语言模型,拥有 8.04B 参数规模。 在代码生成和理解方面表现出色。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 VideoLLaMA3 7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
8.04B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
Vision:centric multimodal design
...