全方位的多模态大模型能力评测体系。
AI模型评估平台,支持多模型对比和性能评测。
Seedance 是字节跳动 Seed 团队推出的新一代多模态 AI 视频生成模型,采用统一的多模态音视频联合生成架构,原生支持文本、图像、音频、视频四种输入模态,单次前向传播即可同步输出 2K 高清画面与匹配音轨。
讯飞星辰MaaS是科大讯飞推出的智能化模型精调与推理服务平台,面向开发者提供"数据-模型-服务"全链路工程化解决方案。讯飞星辰MaaS模型集市提供丰富模型资源,支持精调、API调用、体验、一键部署。
Nano Banana(Gemini 2.5 Flash Image) 是谷歌推出的图像生成与编辑模型,包含Nano Banana模型和Nano Banana Pro(Gemini 3 Pro Image)模型。Nano Banana,基于 Gemini 2.5 Flash Image 架构,以生成有趣的3D玩偶风格图像而闻名,适合快速创意编辑。Nano Banana Pro,基于更先进的 Gem
Bloom是质变科技Powerdrill推出的首款AI决策智能体,能解决复杂数据分析和决策中的准确性、可解释性和可用性问题,基于智能体团队协作(如分析师Anna、工程师Eric等)和“Canvas脑图”交互模式,实现零门槛、沉浸式数据洞察。
Cherry Studio 是集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的开源全能 AI 客户端助手。Cherry Studio支持 Windows、macOS 和 Linux 系统,降低技术门槛,让零基础用户也能快速上手,同时为开发者提供强大的扩展能力。
书生大模型是上海人工智能实验室推出的系列AI模型,基于强大的推理能力、多模态理解和高效的信息处理,推动AI技术的发展。书生大模型体系包括多个子模型,如书生·浦语、书生·万象、书生·风乌等,覆盖语言处理、多模态理解、气象预测等多个领域。
无阶未来是AI应用与弹性算网平台,专注于为用户提供强大的算力支持和丰富的AI应用服务。无阶未来提供多种类型的显卡资源,用户可以根据需求选择合适的资源进行AI应用的训练和部署
豆包大模型是字节跳动推出的AI大模型家族,包括 豆包PixelDance、豆包Seaweed 视频生成、文生图、图生图、同声传译、角色扮演、语音合成、声音复刻、语音识别、Function Call和向量化等多个模型。豆包大模型具备强大的语言理解、生成和逻辑能力,能进行个性化创作、情绪丰富的语音合成、高精度语音识别、多风格图像生成和顶级的视频生成。
商量SenseChat是商汤科技基于自研的大型人工智能模型体系“日日新”(SenseNova)所开发的AI聊天助手,能够协助用户完成各种复杂的AIGC任务,包括多轮对话、逻辑推理、语言纠错、内容创作和情感分析等多种功能。
Llama 3是Meta公司最新开源推出的新一代大型语言模型(LLM),包含8B和70B两种参数规模的模型,标志着开源人工智能领域的又一重大进步。作为Llama系列的第三代产品,Llama 3不仅继承了前代模型的强大功能,还通过一系列创新和改进,提供了更高效、更可靠的AI解决方案。
Gemma是由谷歌DeepMind和谷歌的其他团队开发的一系列轻量级、先进的开放AI模型,基于与Gemini模型相同的技术,旨在帮助开发者和研究人员构建负责任的AI应用。Gemma模型系列包括两种权重规模的模型:Gemma 2B 和 Gemma 7B,提供预训练和指令微调版本,支持多种框架,如JAX、PyTorch和TensorFlow,以在不同设备上高效运行。
天壤小白是天壤公司推出的基于大语言模型的AI应用开发平台,能为用户提供简单易用的工具,帮助开发者快速构建和部署基于大语言模型的应用程序。
Jan(Jan.ai)是一个免费开源的本地运行大模型并进行AI聊天对话的工具,可帮助用户在本地电脑(Windows、Mac、Linux)上安装、部署、运行并使用开源版本的ChatGPT替代大模型,如LLaMa、Mistral、Phi-2等20多个模型,也支持输入自己的OpenAI API Key以运行GPT。
MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型,不仅具备高度的美学导向和图像处理能力,还能够广泛地应用于多个行业,提高工作流效率。
Ollama是一个用于在本地计算机上运行大型语言模型的命令行工具,允许用户下载并本地运行像Llama 2、Code Llama和其他模型,并支持自定义和创建自己的模型。该免费开源的项目,目前支持macOS和Linux操作系统,未来还将支持Windows系统。
腾讯混元是腾讯公司推出的多功能大语言模型,具备强大的自然语言处理和生成能力。支持多种应用场景,如对话交互、视觉生成、代码辅助、文档编辑、知识问答等,能帮助用户高效完成任务并提升内容创作效率。
Cohere是一个提供大语言模型的平台,帮助开发人员和企业构建高性能的AI产品。该平台主要提供AI驱动的搜索文本(多语言嵌入、神经搜索、搜索排名)、分类文本和生成文本等服务,可帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量检索等。
Watsonx.ai是IBM于5月9日发布的新一代企业级生成式人工智能和机器学习平台,Watsonx.ai将由基础模型驱动的新的生成性人工智能和传统的机器学习结合起来,成为一个跨越人工智能生命周期的强大平台。使用Watsonx.ai,开发人员可以轻松地训练、验证、调整和部署模型,只需用一小部分数据在短期时间内快速建立人工智能应用。
Gradio是一个开源的Python库,用于构建演示机器学习或数据科学,以及web应用程序。用户可以使用Gradio基于自己的机器学习模型或数据科学工作流快速创建一个漂亮的用户界面,让用户可以尝试拖放他们自己的图像、粘贴文本、录制他们自己的声音,并通过浏览器与您的演示程序进行交互。
DeepFloyd IF是由StabilityAI旗下的DeepFloyd研究团队推出的开源的文本到图像生成模型,IF是一个基于级联方法的模块化神经网络。
StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习(RLHF)训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的 LLaMA 130亿模型。
Lamini是一个LLM引擎,可以让不仅仅是机器学习专家的任何开发人员,都能在大型数据集中,把高性能的LLM训练得像ChatGPT一样好。
序列猴子是出门问问推出的一款超大规模的语言模型,具有长序列、多模态、单模型、大数据等特点。利用其通用的表示能力与推理能力,用户能够进行多轮交互,从而在使用中获得更加便捷流畅的体验。
StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型
MOSS是复旦大学团队开发的国内第一个发布的对话式大型语言模型,今年2月邀公众参与内测。它可以执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。4月21日,新版MOSS模型正式上线并宣布开源。
AutoGPT是实验性开源应用程序,展示了GPT-4语言模型的真正潜力,GitHub上超10万人星标。该程序由 GPT-4 驱动,将LLM大语言模型思维链接在一起,以自主实现你设定的任何目标。帮助用户创建、部署和管理能够自动执行复杂工作流的AI Agent。
AgentGPT 是能在浏览器中运行的自主人工智能工具。用户通过设定目标(如创建报告、规划旅行或制定学习计划等),AgentGPT 自动思考任务、执行并从结果中学习,以达成目标。AgentGPT 支持自定义目标,具备强大的灵活性和自主性。
微软开源的低成本实现类似ChatGPT的模型训练