实用AI 工具与技术
- • AI技术概览图: 展示了人工智能 (Artificial Intelligence)、AI技术 (AI Techniques - Symbolic AI, Machine learning techniques)、AI任务 (AI Tasks - Answering questions, Recognizing images, etc.)、机器学习任务 (Machine learning tasks - Supervised learning, Reinforcement learning, etc.) 和优化技术 (Optimisation techniques - Gradient descent, Backpropagation) 之间的关系。
- • 16个AI核心概念:
- • 人工智能(AI): 教机器像人一样思考和掌握技能。
- • 机器学习(ML): 让机器自己学习的方法。
- • 深度学习: ML中的"学霸",处理更复杂任务。
- • 神经网络: 机器的"大脑",节点连接协同工作。
- • 强化学习: 通过"奖励"机制学习。
- • 自然语言处理(NLP): 让机器理解和使用人类语言。
- • AI偏见: 因训练数据不全导致机器"有偏见"。
- • AI伦理: 研究AI发展带来的道德问题。
- • 生成对抗网络(GANs): 两个AI互相较劲,一个创造一个判断。
- • 生成式AI: 能创造新内容的AI (文章、画画、作曲)。
- • 监督学习: 给机器标准答案来学习。
- • 无监督学习: 让机器自己发现知识和规律。
- • 计算机视觉: 让机器"看懂"图片和视频。
- • 算法: 机器处理问题的"菜谱"。
- • AI模型: 训练好的"智能程序"或"专家"。
- • 数据挖掘: 从海量数据中找到有价值信息。
- • AI Agent工作流程示意图:
- • 感知 (Inputs): AI接收信息 (文字、图片、语音等)。
- • 大脑 (Decision Making): 记忆、知识库、决策规划、调用工具 (API)、推理。
- • 行动 (Embodiment): 生成文字回答、控制实体设备。
- • 环境 (Environment): 与用户互动的场景。
- • 混合专家模型 (MoE) 论文分析:
- • 核心论点: MoE是大数据时代AI重要范式,适合处理大数据。
- • 研究方法: 文献综述、案例分析、比较分析、问题分析、趋势展望。
- • 主要发现: MoE通过“分而治之”应对大数据挑战,在多领域有优势和应用。
- • 创新之处: 全方位应用研究,强调优势与挑战,提出“零计算专家”概念。
- • 局限性: 缺乏工程实现细节、具体挑战解决方案研究、量化预测等。
- • 生成式AI发展时间线 (Timeline of Generative AI):
- • 展示了文本、代码、图像、视频/3D/游戏等领域从2020年前到2030年的发展预测和状态。
- • 2024年度最受欢迎的100款AIGC产品图:
- • 分类包括:AI智能助手 (文心一言、豆包、Kimi)、AI翻译、AI生图、AI视频、AI PPT、AI写作、AI搜索、AI Agent、AI教育、AI音乐/音效、代码生成、多功能套件等。
- • LangChain v0.2: 迈向稳定的飞跃,分离 langchain 和 langchain-community,改进文档,增强代理框架。
- • Ollama: 开源大语言模型运行框架。
- • 功能:本地运行开源LLM (Llama3, Mistral, Gemma),提供命令行和API,支持自定义模型、量化优化。
- • 易用性:简化LLM下载、配置过程,如
ollama run llama3
。
- • 平台:Linux, macOS, Windows, Docker。
- • DeepSeek:
- • 腾讯元宝已接入 DeepSeek-R1。
- • DeepSeek 与 AI 幻觉:探讨其产生原因、评测、减缓方法及创造力价值 (清华大学研究)。
- • DeepSeek 35个实用入门指令大全。
- • DeepSeek赋能家庭教育报告 (由DeepSeek辅助生成)。
- • DS卡片:将DeepSeek回答一键转换为精美长图,智能识别Markdown。
- • Deep Research 使用技巧 (OpenAI): 更多计算带来更好结果,清晰指令,明确关键词,使用动词,指定输出格式,上传文件上下文,核查来源。
- • Coze自动化教程列表:
- • 基础与机器人建立、插件与工作流提取抖音文案 (多版本)、文本转脑图、工作流代码编写、选择器应用、发布到微信/飞书、长文本处理、自定义插件、批量提取文案、踩坑总结等。
- • 可灵 AI (Keling AI): 短片打造,官方教程,爆款秘籍,基础入门,镜头控制,口型应用,人脸模型,提示词入门等。
- • AI PPT工具: Gamma, Tome, Mindshow, 美图AI, ChatBA, Decktopus, Slides AI, Powerpresent, Beautiful AI。
- • Cursor (AI代码编辑器):
- • 重置试用期方法 (提示 "Too many free trial accounts")。
- • 安装方法 (Linux/macOS/Windows)。
- • 朱雀大模型检测器 (isgen.ai) 可检测AI生成内容。
- • Gemini Search: 开源项目,结合Google Gemini 2.0 Flash模型和Google搜索API,提供基于实时网络资源的AI问答。
- • OpenAI模型选择指南 (o3-mini-high, o1, gpt-4o):
- • STEM任务选 o3-mini-high。
- • 非STEM:深度思考选 o1 (文科之王);普通任务选 gpt-4o (知识之神, 多模态)。
- • 具体场景任务推荐及价格质量权衡。
- • Claude (AI模型):
- • Cheat Sheet: 设置 (连接Google Drive, 个性化上下文), 主要功能 (Artifacts, Native Screenshots, 交互式仪表盘, 数据分析可视化)。
- • Top Use Cases: Excel公式/SQL查询, 快速图表, 简单原型制作, 会议邮件, 编辑邮件/文档, 获取策略反馈, 创建文档。
- • 5个常见错误及避免方法: 忘记随机性 (多试几次), 聊天过长 (开新聊天/用Projects), 未提供足够示例, 未充分迭代, 未对AI输出进行最后20%的人工润色。
- • AI与程序员: AI取代程序员的焦虑源于对编程本质的误解。AI是工具革新的最新一环,能写if-else,但无法理解为何需要。
- • PDF格式解析方案:
- • 技术方案: LLM/视觉大模型解析, OCR模型, 传统规则提取。
- • 开源/闭源方案列举: document-convert, Ragflow, gptpdf, marker, PDF-Extract-Kit, zerox, OminiParse, MinerU (开源); 百度云Textmind, doc2x, 腾讯云文档解析 (闭源)。
- • 评估方法: 人工评估,针对数字PDF和扫描PDF的复杂场景。