零基础学人工智能:什么是生成式人工智能
生成式AI(Generative AI,有时缩写为 GenAI)也是人工智能技术的一种。准确的说,生成式 AI 属于广泛意义上 AI 的一个子集。它能够根据给定的需求生成新的、原创的内容,包括生成文本、图像、音频、视频和其他类型的内容。生成式 AI 的工作原理其实并不复杂。它通过学习大量的数据(包括文本、图像、音频或视频等),让计算机系统“学会”如何重新组合和排列这些元素,从而创造出全新的内容。
01 什么是生成式 AI
生成式AI(Generative AI,有时缩写为 GenAI)也是人工智能技术的一种。准确的说,生成式 AI 属于广泛意义上 AI 的一个子集。
它能够根据给定的需求生成新的、原创的内容,包括生成文本、图像、音频、视频和其他类型的内容。你只需要告诉它你想要什么(比如写一篇感谢信、画一张风景画、谱写一段音乐等),它就能根据你的要求生成出来。
生成式 AI 的工作原理其实并不复杂。它通过学习大量的数据(包括文本、图像、音频或视频等),让计算机系统“学会”如何重新组合和排列这些元素,从而创造出全新的内容。
比如,如果你想让它生成一篇文章,它会先学习成千上万篇已经写好的文章,然后尝试模仿这些文章的写作风格和主题,从而生成一篇新的文章。
这就像是我们在学习画画时,会先观察大师的作品,学习他们的技巧和风格,然后再尝试自己创作。生成式 AI 也是这样的“学徒”,只不过它的学习速度和创作能力远远超过了我们人类。
尽管生成式 AI 具有巨大的潜力,但它也面临着一些挑战。其中之一是如何确保生成的内容符合道德和法律标准,避免传播有害信息或侵犯版权。此外,生成式 AI 可能会被滥用,用于制造虚假信息、网络钓鱼攻击等恶意行为。因此,研究人员和开发者需要不断努力,改进生成式 AI 的技术,以确保其安全、可靠且有益于人类社会的发展。
下面,我们对生成式 AI 的几个不同应用方向分别做一些详细介绍。
02 生成文本
在文本生成领域,它可以自动生成新闻稿件和社交媒体内容,也可以用来编写故事、生成诗歌、编写代码等;
在这个领域,生成式 AI 基于大量的文本数据学习,自动生成连贯、有意义的文字内容。用一句老话来形容,那就是书读百遍,其义自现。说白了就是读书多了,就算不懂某句古诗或者古文的意思,但是起码是背下来了,直接就背出来了。
生成式 AI 就是读了巨量的「书」,这些资料有的来自于书籍,有的来自于互联网,它的记忆里存储了大量的知识,这一点儿跟人类其实非常的像。所以当你给它一个主题,它就能像泉水一样涌出相关的句子和段落。
示例一:小说创作
假设你正在构思一部小说,但是灵感突然枯竭了。这时,你可以请生成式 AI 来帮忙。只需输入你想要的主题、人物设定和故事背景,它就能迅速为你生成一个完整的小说大纲,甚至还能为你填充具体的章节内容。这样一来,你就能轻松完成一部引人入胜的小说了!
示例二:新闻撰写
生成式 AI 通过学习和分析大量的新闻数据,它能够自动生成与当前热点事件相关的新闻报道。这些报道不仅内容准确、结构清晰,而且能够迅速满足读者对新闻信息的需求。
示例三:广告创意
生成式 AI 能够根据广告主的需求和目标受众的特点,自动生成具有创意和吸引力的广告文案。这些文案不仅能够吸引潜在客户的注意力,还能有效传达广告信息,提高广告效果。
示例四:聊天机器人
那些善解人意、能和你聊得来的在线客服,很多都是生成式 AI 的功劳。它们不仅回答问题,还能理解情感,让你感觉像是在和真人交流。
知名产品:
ChatGPT(https://chatgpt.com/):由 OpenAI 开发的大语言模型,是目前文本生成领域最为知名的明星,能完成从写诗到编程的各种文本任务。
Google Gemini(https://gemini.google.com):Google 的对话式 AI 服务,专注于提供准确、人性化的答案和建议。
Kimi(https://kimi.moonshot.cn/):月之暗面的 AI 服务,以对话的形式进行文本生成,展现出了惊人的互动性和创造力。
通义千问(https://tongyi.aliyun.com/qianwen/):阿里云的大语言模型,致力于提供高质量的文本生成服务。
文心一言(https://yiyan.baidu.com/):百度推出的知识增强大语言模型,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。
GitHub Copilot(https://github.com/features/copilot):一款基于云的人工智能工具,可帮助程序员自动完成代码编写,提高编程效率。
03 生成图像
在图像合成方面,它可以创建逼真的人脸照片、设计艺术作品、甚至生成虚拟世界的场景。
就像是一个超级艺术家,生成式 AI 不拿画笔,也不用颜料,而是通过学习海量的图像数据,理解了什么是山川湖海、花鸟鱼虫,甚至是科幻世界中的奇观异景。当你给它一个想法或者一句话,它就能在心中绘出相应的画面,然后像变魔术一样展现在你眼前。
示例一:文字变图像
想象一下,你输入“一只可爱的卡通熊猫在吃竹子”,AI就能生成一张栩栩如生的卡通熊猫图片,简直就像是从你的想象中走出来的一样。
示例二:个性化头像制作
个性化头像制作:想要一张独一无二的社交头像?告诉 AI 你的喜好,比如“戴着墨镜的猫咪,背景是星空”,它就能为你生成这样的头像,保证你是朋友圈里最靓的仔。
示例三:虚拟旅行摄影
想看看巴黎铁塔下的夕阳,还是马尔代夫的碧海蓝天?生成式 AI 能根据你的愿望,创造出身临其境的风景照,让你足不出户游遍天下。
示例四:时尚设计助手
设计师需要灵感?AI 能根据最新的潮流趋势,生成一套套服装设计图,从复古风到未来感,应有尽有。
知名产品:
Midjourney(https://www.midjourney.com):让你通过简单的文本提示探索无限创意图像的平台,是艺术创作和设计的好帮手。
Stable Diffusion(https://stability.ai/):开源的图像生成模型,用户可自由定制,创造出风格各异的艺术作品。
DALL·E(https://chatgpt.com/):OpenAI 的图像生成模型,能根据文字描述创造惊人的真实感图像,从抽象概念到具体物品,无所不能。
Bing Image Creator(https://bing.com/create):微软推出的图像生成工具,能够根据用户输入的文本或关键词生成相关的图像。
Imagen(https://imagen.research.google/):Google 推出的从文本生成图像工具,它能够生成高质量、逼真的图像。
04 生成音乐
生成式 AI 还可以用于语音合成,帮助我们生成独特的音乐,为虚拟助手、游戏角色等提供自然流畅的语音输出。
就像是一个无师自通的音乐家,它不需要像我们一样从小学五线谱,也不用练习指法。它通过分析数百万首歌曲,从古典到流行,从爵士到摇滚,学会了音乐的语言和规则。
当你给它一些线索,比如“一个雨夜的浪漫爵士”,它就能编织出一段段旋律,仿佛它自己也在那个雨夜漫步,感受着那份温柔。
示例一:自动作曲
通过分析大量音乐作品,学习不同风格的音乐特征,然后自动生成新的旋律和和声,它就能够根据输入的文本,生成与之相匹配的音乐片段。
示例二:个性化音乐电台
想象你有一个专属DJ,它不仅知道你喜欢什么类型的音乐,还能在你感到开心或失落时,即时创作出最适合当前心情的曲子。
示例三:游戏背景音乐
游戏场景切换,音乐随之变化,从宁静村庄到激战战场,生成式 AI 都能实时创作,让游戏体验更加沉浸。
示例四:广告配乐定制
广告商想要独特而吸引人的背景音乐?生成式AI能够根据广告的主题和风格,创作出独一无二的旋律。
知名产品:
Suno(https://suno.com/):Suno 是一个专业高质量的AI歌曲和音乐创作平台,用户只需输入简单的文本提示词,即可根据流派风格和歌词生成带有人声的歌曲。
AIVA(https://www.aiva.ai/):一个专为音乐家和作曲家设计的AI音乐创作平台。
Amper Music(https://www.audoir.com):一个为品牌和媒体公司创建定制音乐的平台。
Google Magenta(https://magenta.tensorflow.org/):一个致力于推动音乐和视觉艺术的机器学习项目。
BandLab’s Songwriter(https://www.bandlab.com/songstarter):一个由BandLab推出的AI驱动的音乐创作工具。
05 生成视频
它还可以根据给定的提示词创作视频。就像是一个超级聪明的视频编辑,它不只剪辑已有的素材,还能够从零开始创造全新的视频内容。
它通过研究成千上万小时的视频,学会了如何构建场景、安排镜头、甚至理解情感和叙事结构。当你告诉它一个故事梗概,它就能像变魔术一样,创造出符合你想象的视频片段。
示例一:个性化广告
假设你是一家冰淇淋店的老板,想要一个既独特又吸引人的广告。生成式 AI 会根据你的品牌风格和目标顾客,制作出一个夏日午后,孩子们欢笑中享受冰凉甜品的温馨场景。
示例二:教育动画
复杂的科学概念变得易懂。AI 可以创作动画解释黑洞原理,或者细胞分裂过程,让学习就像看动画片一样有趣。
示例三:AI动画短片
通过输入一段文字描述或故事情节,AI 可以自动生成与之匹配的动画短片。这些短片不仅画面精美,而且情节连贯,仿佛是由专业动画师亲手绘制的一样。
示例四:影视特效制作
生成式 AI 在影视特效制作方面也大有作为。通过深度学习算法,AI 可以自动识别和替换视频中的背景、物体等元素,从而制作出令人震撼的特效效果。
知名产品:
Sora(https://openai.com/sora/):OpenAI 推出的视频制作工具,截止到目前还没有正式发布。
CogVideo(https://models.aminer.cn/cogvideo/):由清华大学开发的视频生成模型,展示了AI在视频生成领域的强大能力。
Pika(https://pika.art/home):一款功能强大的视频生成工具,支持多种视频格式和分辨率的生成。
Runway(https://runwayml.com/):一款专注于高质量视频生成的AI模型,备受业界关注。
Stable Video(https://www.stablevideo.com):Stable Video 是一个基于 AI 的视频生成平台,用户可以通过文本或图像将概念转化为引人入胜的视频。
06 小结
生成式 AI 能够根据给定的需求生成新的、原创的内容,包括生成文本、图像、音频、视频和其他类型的内容。
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)