文章博客 - 56分类目录

13℃极客时间AI免费课 – 4小时快速入门AI大模型

AI大模型快速入门指南极客时间训练营推出的“AI大模型快速入门指南”课程，由LangChain开发者、谷歌开发者专家彭靖田主讲，涵盖AIGC、LangChain、Transformer等核心知识点。课程包括4小时视频教学、大模型技术总览、...

文章资讯

2026-02-07 15:39:50

14℃Michael Jordan：机器学习领域的领军人物、美国国家工程院院士 – AI名人堂

体育界篮球运动有个无人不知的迈克尔·乔丹，而机器学习领域同样有一位迈克尔·乔丹。Michael Jordan的简介Michael Irwin Jordan（生于1956年2月25日）是一位美国科学家，加州大学伯克利分校教授，机器学习、统计...

生活百科

2026-02-06 09:47:18

16℃李飞飞：ImageNet创建者、美国国家工程院院士、斯坦福大学教授 – AI名人堂

个人简介李飞飞（英文名：Fei-Fei Li），生于1976年，是一位华裔美国计算机科学家，因建立ImageNet而闻名，该数据集使计算机视觉在2010年代取得了快速发展。她是斯坦福大学计算机科学的红杉资本教授，也是Twitter的前...

生活百科

2026-02-06 09:47:09

12℃Andrew Ng 吴恩达：Google Brain的联合创始人、百度前首席科学家及Coursera联合创始人 – AI名人堂

吴恩达个人简介吴恩达（Andrew Yan-Tak Ng），（1976年）英国出生的美国计算机科学家和技术企业家，专注于机器学习和人工智能（AI）。吴恩达是谷歌大脑的联合创始人和负责人，并曾是百度的首席科学家，将百度的人工智能小组建...

生活百科

2026-02-06 09:47:02

9℃Ian Goodfellow：生成式对抗网络GAN的发明人 – AI名人堂

Ian J. Goodfellow（生于1985年或1986年）是一位美国计算机科学家、工程师和高管，最著名的是他在人工智能神经网络和深度学习方面的工作。他之前曾担任谷歌大脑的研究科学家和苹果公司的机器学习主管，并在深度学习领域做出了几项...

生活百科

2026-02-06 09:46:54

24℃什么是嵌入表示（Embedding Representations） – AI百科知识

在探索人工智能的复杂世界中，嵌入表示（Embedding Representations）将抽象概念如文字、图像或声音转化为机器可理解的数学语言——向量形式的桥梁。这种转换使得机器能够“理解”数据，还能揭示数据间的深层关系，为各种智能应用打...

站长百科

2026-02-05 14:23:09

27℃什么是智能体（Agents） – AI百科知识

什么是智能体智能体是人工智能中的一个核心概念，英文名Agents或AI Agents，它不仅仅是一个被动的观察者，而是一个能够主动与环境交互并产生影响的实体。智能体可以被定义为一个能够感知环境、做出决策并采取行动以实现特定目标的自主实体。...

站长百科

2026-02-05 14:22:58

16℃什么是循环神经网络（RNN） – AI百科知识

在人工智能的领域中，循环神经网络（RNN）是一种特殊的神经网络结构，它在处理序列数据方面展现出了卓越的能力。本文将从多个角度深入探讨RNN的相关知识，包括其定义、结构、工作原理、应用场景、优缺点、变体以及一些常见问题。循环神经网络是什么...

站长百科

2026-02-05 14:22:50

24℃什么是弱监督学习（Weakly Supervised Learning） – AI百科知识

在人工智能的宏伟蓝图中，机器学习扮演着至关重要的角色，而监督学习更是其中的核心。传统的监督学习依赖于大量精确标注的数据来训练模型，以期达到对未知数据的准确预测。但在现实世界中的数据往往并非如此理想：标注成本高昂、专家资源有限、数据质量参差不...

站长百科

2026-02-05 14:22:38

18℃什么是对抗性训练（Adversarial Training） – AI百科知识

对抗性训练（Adversarial Training）是机器学习领域中一种创新的技术，通过在训练过程中刻意引入精心设计的扰动，增强模型对潜在攻击的防御能力。不仅提高了模型在面对恶意攻击时的鲁棒性，还提升了其在标准数据上的性能。随着人工智能系...

站长百科

2026-02-05 14:22:28

21℃什么是嵌入向量（Embedding Vectors） – AI百科知识

在人工智能的广阔领域中，嵌入向量（Embedding Vectors）扮演着至关重要的角色。将复杂的数据结构，如文本、图像和声音，转化为机器能够理解的数值表示，解锁了深度学习在自然语言处理、图像识别和推荐系统等领域的潜力。随着技术的不断进步...

站长百科

2026-02-05 14:22:21

27℃什么是知识图谱（Knowledge Graph） – AI百科知识

知识图谱（Knowledge Graph）作为人工智能领域的一项关键技术，通过将海量信息转化为结构化的语义网络，极大地增强了机器对数据的理解和处理能力。推动了智能搜索和推荐系统的革新，在金融、医疗、教育等多个行业中展现出巨大的应用潜力。随着...

站长百科

2026-02-05 14:22:08

11℃Yann LeCun：深度学习三巨头之一，图灵奖获得者 – AI名人堂

Yann André LeCun（中文名杨立昆）（1960年7月8日－）是一位法国计算机科学家，主要从事机器学习、计算机视觉、移动机器人和计算神经科学领域的工作。他是纽约大学Courant数学科学研究所的Silver教授，也是Meta（F...

生活百科

2026-02-05 09:14:55

9℃Yoshua Bengio：深度学习三巨头之一，图灵奖获得者 – AI名人堂

Yoshua Bengio（1964年3月5日－）是一位加拿大计算机科学家，以其在人工神经网络和深度学习方面的工作而闻名。他是蒙特利尔大学计算机科学与运筹学系教授，也是蒙特利尔学习算法研究所（MILA）的科学主任。Bengio与Geof...

生活百科

2026-02-05 09:14:47

12℃Jeff Dean：Google AI掌门人 – AI名人堂

如果你是开发人员的话，我想你应该听说过数不清的关于Jeff Dean大牛的笑话，其中最广为流传的便是“编译器从来不给Jeff编译警告，而是Jeff警告编译器”、“所有指针都是指向Jeff的”，这足以侧面印证出Jeff Dean的实力。J...

生活百科

2026-02-05 09:14:40

9℃Geoffrey Hinton：深度学习之父，图灵奖获得者 – AI名人堂

杰弗里·埃弗里斯特·辛顿，（英语：Geoffrey Everest Hinton，1947年12月6日－），英国出生的加拿大计算机学家和心理学家，多伦多大学教授。以其在类神经网络方面的贡献闻名。Hinton是反向传播算法和对比散度算法的发...

生活百科

2026-02-05 09:14:31

13℃如何安装和使用DragGAN？在线和本地运行的4种方法

DragGAN是一个热门的开源AI图像项目和研究，可以通过拖动对图像中的静态对象的姿势、形状、表情和方向等进行灵活而精确的控制，可以实现比如将动物的嘴张开、将汽车的角度更改、将风景中的山体拔高等操作。近期，DragGAN的团队在GitHub...

建站教程

2026-02-05 09:14:11

13℃如何运行Stable Diffusion？在线和本地运行的5种方法

Stable Diffusion是由初创公司Stability AI和来自慕尼黑大学以及Runway的研究人员在2022年发布的文本到图像的生成模型，支持文生图、图生图、修改图像、填充低分辨率图像等功能。由于其免费开源，并且生成的图片质量较...

建站教程

2026-02-05 09:14:03

17℃如何免费使用GPT-4？不开会员的6种方法

GPT-4是OpenAI推出的最新GPT大语言模型的版本，该模型具有强悍的多模态能力，不仅可以解析文本代码，还可以处理图像输入。目前官方版的GPT-4仅能通过ChatGPT Plus付费会员才能使用，免费版的ChatGPT无法使用最新的GP...

建站教程

2026-02-05 09:13:55

12℃Claude Computer Use – Anthropic推出支持AI自动化操作电脑任务的功能

Claude Computer Use是什么Claude Computer Use是Anthropic公司推出的新功能，支持AI模型Claude 3.5 Sonnet 执行类似人类的电脑操作，如查看屏幕、移动光标、点击按钮和输入文本。基于...

创业资讯

2026-02-05 09:13:43

9℃WebRL – 清华联合智谱AI推出的自进化在线课程强化学习框架

WebRL是什么WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架，训练使用开放大型语言模型（LLMs）的高性能网络代理。WebRL动态生成任务、结果监督奖励模型（ORM）评估任务成功与否，及自适应强化学习策略，解决训...

创业资讯

2026-02-05 09:13:33

12℃Docling – IBM开源的文档解析工具

Docling是什么Docling是开源的文档解析和转换工具，能高效地将多种格式的文档（包括PDF、DOCX、PPTX、图片和HTML）解析，导出为Markdown或JSON格式。Docling支持高级PDF理解、OCR功能，能与Llam...

创业资讯

2026-02-05 09:13:25

11℃Cerebellum – 浏览器AI助手，完成网页自动化任务和行动规划

Cerebellum是什么Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver构建的浏览器AI智能助手，能理解任务意图、执行网页自动化任务，如数据抓取和网站自动化测试。Cerebellum将网...

创业资讯

2026-02-05 09:13:14

14℃AI研究院推出的布局可控AI绘画模型

HiCo是什么HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型，HiCo基于多分支结构设计，实现对对象位置和文本描述的精确控制。HiCo的关键特点在于进行空间解耦，有效地处理复杂布局，减少对象缺失和视角冲突等问...

创业资讯

2026-02-05 09:12:45

13℃OuteTTS – 开源的文本到语音合成项目，基于纯语言建模方法生成语音

OuteTTS是什么OuteTTS是开源的文本到语音（TTS）项目，基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构，用Oute3-350M-DEV基础模型，拥有3.5亿参数。OuteTTS具备音频标记化、CTC强制对齐...

创业资讯

2026-02-04 18:15:54

14℃AI视频生成应用代码库，支持多模型和全面的视频生成流程

VideoTuna是什么VideoTuna是集成多种AI视频生成模型的代码库，支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提供预训练、持续训练、后训练对齐和微调等全面视频生成流程，支持U-Net和DiT架构，并计划推出...

创业资讯

2026-02-04 18:15:33

14℃AI网页浏览框架，提供简单和可扩展的网页自动化解决方案

Stagehand是什么Stagehand是简单和可扩展的AI网页浏览框架，是Playwright的继承者，提供act、extract和observe三个简单的API，支持自然语言驱动的网页操作。Stagehand提供一个轻量级、可配置、...

创业资讯

2026-02-04 18:13:57

0℃GameGen-X – 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

GameGen-X是什么GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型，用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能，如创新角色、动态环境、复杂动作和多样化事件，支持用户用文本指令和键盘...

创业资讯

2026-02-04 17:28:25

15℃开源的AI视频编辑工具，支持视频转视频和局部编辑

ComfyUI-MochiEdit是什么ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的开源视频编辑工具，基于将视频转换为噪声、重新采样实现视频编辑，支持局部编辑和视频转视频功能。用户能调整噪声校正强度、对...

创业资讯

2024-11-07 10:04:47