Lingshu-7B - 阿里巴巴大型语言模型

Posted on 六月 15, 2025

Lingshu-7B - 阿里巴巴大型语言模型模型概述Lingshu-7B 是阿里巴巴公司于 2025 年 6月发布的大型语言模型，拥有 7B (also 32B variant available) 参数规模。采用 MIT 开源许可证，允许商业使用和二次开发，为企业提供了极大的灵活性。 Lingshu-7B 在开源社区获得了广泛认可，Hugging Face 平台上的下载量已达到 N/A，获得了 N/A 个点赞，显示出强大的社区影响力和用户认可度。 Lingshu-7B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 7B (also ...

阅读全文

Qwen2.5-7B-Instruct - 阿里巴巴大型语言模型

Posted on 九月 16, 2024

Qwen2.5-7B-Instruct - 阿里巴巴大型语言模型模型概述Qwen2.5-7B-Instruct 是阿里巴巴公司于 2024 年 9月发布的大型语言模型，拥有 7B 参数规模。该模型经过指令微调，专门针对对话和任务执行场景进行了优化。该模型支持多种语言，能够处理包括中文、英文在内的多语言任务，具备强大的逻辑推理和数学推理能力。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Qwen2.5-7B-Instruct 在开源社区获得了广泛认可，Hugging Face 平台上的下载量已达到 5.2M，获得了 816 个点赞，显示出强大的社区影响力和用户认可度。在性能方面，支持 128K tokens 的超长上下文窗口。核心特性 7B 参数规模：采用大规模参数设计，在性能和...

阅读全文

Qwen2-0.5B - Qwen2 0.5B ultra-lightweight model

Posted on 六月 7, 2024

Qwen2-0.5B - Qwen2 0.5B ultra-lightweight model模型概述Qwen2-0.5B 是阿里巴巴公司于 2024 年 6月发布的大型语言模型，拥有 0.5B 参数规模。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Qwen2-0.5B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 0.5B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡 Apache 2.0 开源许可：完全商业友好，无使用限制，支持二次开发完全开源...

阅读全文

Qwen2-1.5B - Qwen2 1.5B lightweight model

Posted on 六月 7, 2024

Qwen2-1.5B - Qwen2 1.5B lightweight model模型概述Qwen2-1.5B 是阿里巴巴公司于 2024 年 6月发布的大型语言模型，拥有 1.5B 参数规模。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Qwen2-1.5B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 1.5B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡 Apache 2.0 开源许可：完全商业友好，无使用限制，支持二次开发完全开源：模型权重和...

阅读全文

Qwen2-72B - Qwen2 72B flagship model

Posted on 六月 7, 2024

Qwen2-72B - Qwen2 72B flagship model模型概述Qwen2-72B 是阿里巴巴公司于 2024 年 6月发布的大型语言模型，拥有 72B 参数规模。 Qwen2-72B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 72B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡完全开源：模型权重和代码完全开放，便于研究和定制化开发高效推理：采用优化的模型架构，支持快速推理和批量处理易于集成：提供标准的API接口，支持主流深度学习框架同系列模型Qwen2-72B 属于 Qwen 系列模型。该系列通常包含多个不同规模的...

阅读全文

Qwen2-7B - Qwen2 7B with improved 多语言支持 capabilities

Posted on 六月 7, 2024

Qwen2-7B - Qwen2 7B with improved 多语言支持 capabilities模型概述Qwen2-7B 是阿里巴巴公司于 2024 年 6月发布的大型语言模型，拥有 7B 参数规模。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Qwen2-7B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 7B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡 Apache 2.0 开源许可：完全商业友好，无使用限制，支持二次开发完全开源：模型...

阅读全文

Qwen1.5-14B - Qwen1.5 14B model

Posted on 二月 5, 2024

Qwen1.5-14B - Qwen1.5 14B model模型概述Qwen1.5-14B 是阿里巴巴公司于 2024 年 2月发布的大型语言模型，拥有 14B 参数规模。 Qwen1.5-14B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 14B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡完全开源：模型权重和代码完全开放，便于研究和定制化开发高效推理：采用优化的模型架构，支持快速推理和批量处理易于集成：提供标准的API接口，支持主流深度学习框架同系列模型Qwen1.5-14B 属于 Qwen 系列模型。该系列通常包含多个不同规模...

阅读全文

Qwen1.5-0.5B - Qwen1.5 0.5B ultra-lightweight model

Posted on 二月 5, 2024

Qwen1.5-0.5B - Qwen1.5 0.5B ultra-lightweight model模型概述Qwen1.5-0.5B 是阿里巴巴公司于 2024 年 2月发布的大型语言模型，拥有 0.5B 参数规模。 Qwen1.5-0.5B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 0.5B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡完全开源：模型权重和代码完全开放，便于研究和定制化开发高效推理：采用优化的模型架构，支持快速推理和批量处理易于集成：提供标准的API接口，支持主流深度学习框架同系列模型Qwen1.5-0.5B 属...

阅读全文

Qwen1.5-1.8B - Qwen1.5 1.8B lightweight model

Posted on 二月 5, 2024

Qwen1.5-1.8B - Qwen1.5 1.8B lightweight model模型概述Qwen1.5-1.8B 是阿里巴巴公司于 2024 年 2月发布的大型语言模型，拥有 1.8B 参数规模。 Qwen1.5-1.8B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 1.8B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡完全开源：模型权重和代码完全开放，便于研究和定制化开发高效推理：采用优化的模型架构，支持快速推理和批量处理易于集成：提供标准的API接口，支持主流深度学习框架同系列模型Qwen1.5-1.8B 属于 Qwen...

阅读全文

Qwen1.5-72B - Qwen1.5 72B flagship model

Posted on 二月 5, 2024

Qwen1.5-72B - Qwen1.5 72B flagship model模型概述Qwen1.5-72B 是阿里巴巴公司于 2024 年 2月发布的大型语言模型，拥有 72B 参数规模。 Qwen1.5-72B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 72B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡完全开源：模型权重和代码完全开放，便于研究和定制化开发高效推理：采用优化的模型架构，支持快速推理和批量处理易于集成：提供标准的API接口，支持主流深度学习框架同系列模型Qwen1.5-72B 属于 Qwen 系列模型。该系列通...

阅读全文

Qwen1.5-7B - Qwen1.5 7B model with strong Chinese capabilities

Posted on 二月 5, 2024

Qwen1.5-7B - Qwen1.5 7B model with strong Chinese capabilities模型概述Qwen1.5-7B 是阿里巴巴公司于 2024 年 2月发布的大型语言模型，拥有 7B 参数规模。 Qwen1.5-7B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 7B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡完全开源：模型权重和代码完全开放，便于研究和定制化开发高效推理：采用优化的模型架构，支持快速推理和批量处理易于集成：提供标准的API接口，支持主流深度学习框架同系列模型Qwen1.5-7B ...

阅读全文

VideoLLaMA3 7B - 阿里巴巴大型语言模型

Posted on 一月 22, 2024

VideoLLaMA3 7B - 阿里巴巴大型语言模型模型概述VideoLLaMA3 7B 是阿里巴巴公司于 2024 年 1月发布的大型语言模型，拥有 8.04B 参数规模。在代码生成和理解方面表现出色。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 VideoLLaMA3 7B 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 8.04B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡 Vision：centric multimodal design ...

阅读全文