最近在试用下某单位开发提供的一个系统,拖拽上传文件,自动OCR识别,然后可以继续拖拽一个大模型节点,对识别结果进行智能整理。这让我思考了一个问题:👉 这种通过工具组合完成一项工作的系统,到底算不算是“智能体”?什么是智能体,工作流和智能体到底有啥区别?什么是工作流(Workflow)?先来看个日常例子:公司报销流程:1️⃣ 员工提交发票 2️⃣ 系统检查发票是否合规 3️⃣ 超过一定金额需要经理审批 4️⃣ 审批通过后打款这是一条标准的、预定义好的流程,每一步的处理规则都是提前写死的(比如金额 > 5000 元就需要经理审批)。不会因为发票上写了“特急”二字流程就变了。这就是典型的 工作流系统。 工作流擅长处理确定性流程,比如:审批流数据同步流程订单处理流程什么是智能体(Agent)?来看另一个例子:你问一个智能客服机器人:👉“上周我买的那个蓝色的无线耳机坏了,怎么申请换货?”机器人要做的事情是:1️⃣ 理解你的问题(售后问题?换货请求?) 2️⃣ 从数据库中查找相关政策 3️⃣ 结合你账户信息判断是否符合换货条件 4️⃣ 生成一段符合当前情况的回复,告诉你如何操作
原来爸妈家一直使用的是京东赠送的路由器,其实就是pcdn的边缘存储服务,目前运营商正在严查。想着没有必要给他们造成麻烦,索性考虑给他们换下来。家里正好有一台闲置的小米路由器,之前我用它做 AP(无线接入点)模式,给主路由扩展Wi-Fi信号用。想着带到爸妈家直接接光猫当主路由器用正合适。但没想到,忘记提前切换回路由模式,白白折腾了一下子,所以趁机记录一下过程,供以后参考,也希望能帮到有同样需求的朋友。一、出现的问题小米路由器原来配置为 AP 模式(桥接模式)到爸妈家后直接连光猫结果手机连上 Wi-Fi 后获取到的 IP 是 192.168.1.x 段(原光猫默认分配的)无法访问 192.168.31.1,说明小米路由器没有接管 DHCP,也没有处于“路由模式”路由器管理后台显示功能极简,无法设置拨号/端口转发等核心功能二、排查分析结合经验判断:1️⃣ AP模式的特征小米路由器关闭了自己的 DHCP只是作为无线扩展设备存在所以手机获取到的是光猫分配的 192.168.1.x IP2️⃣ 为什么会自动切换到AP?小米路由器在首次接入网络时,会检测上级网络是否已存在 DHCP 服务如果检测到(
最近在打扫房间时,我意外翻出了一台 GL.iNet GL-SFT1200(Opal) 路由器,曾经因为页面打开非常慢,开启 OpenWrt 后体验不佳,一直束之高阁。这次心血来潮,决定尝试通过官方 Web 界面升级来“挽救”它的使用价值,顺便记录一下整个过程和体验,供有类似设备的朋友参考。封存的原因最初购买 GL-SFT1200 是为了便携科学上网与临时搭建小型网络,但实际使用中发现:页面打开非常缓慢,尤其是切换管理界面时几乎卡死。开启 OpenWrt 18.06 后体验更差,LuCI 页面延迟严重。配置稍复杂的插件(如 SSR Plus+、Passwall)基本无法流畅运行。最终被我束之高阁,封存进抽屉。再次尝试的初衷现在 GL.iNet 官方和社区的固件支持更好,新版 OpenWrt(4.x 系列官方固件)优化明显。Web 界面直接支持升级,操作门槛低,正好测试一下是否能改善性能。何不趁机尝试升级下,看看是否能焕发新生?升级准备与流程1️⃣ 选择官方 Web 版本升级方案我选择采用 GL.iNet 官方 Web 界面升级方案,流程友好、不需要折腾 U-Boot 模式,适合日常用户:
AI 大模型时代,很多企业开始探索用 LLM+工具化的方式提升客服效率。 今天我用一个典型场景“电信客服”举例,介绍下如何用 Qwen-Agent 框架快速搭建一个支持多业务查询的智能客服,当然很多内容也是现学现用。场景需求用户常见的咨询问题包括:💰 话费查询📴 停机原因定位📡 网络故障诊断📦 套餐内容查询📈 流量使用查询📝 业务办理进度查询 ... 多达几十类,几百项指标。问题是:如何优雅地支持这些动态查询?系统设计思路核心思路很简单:用户提问 ↓ Agent 通过大模型理解意图 ↓ 选择调用对应的 Tool(函数) ↓ Tool 执行(查实时数据) ↓ 模型生成自然语言回复系统结构图┌──────────────┐ │ 用户提问 │ └────┬─────────┘ ↓ ┌─────────────────────────────┐ │ Qwen-Agent 主体 │ │ ┌──────────────┐ │ │ │ Large Model │ 理解意图 │ │ └─────┬─────
最近我给自己设定了一个“有趣又疯狂”的目标:退休前开发并发布 100 个网站和 App。 如果在 AI 出现之前,这种想法大概会被笑为“天方夜谭”——毕竟一个项目从构想到上线,动辄需要几周甚至几个月的时间,光是代码、设计、测试流程就足以让个人开发者望而却步。但 AI 时代的到来,彻底改变了这种节奏。 有了 AI 编程的帮助,现在一个想法从诞生到上线,往往只需 一两天时间就能完成。而且,AI 还非常适合像我这样有“轻微强迫症”的人:可以通过几轮自动优化,快速实现功能迭代和体验打磨。于是,我决定认真做一件事:开始计数,记录我实现的每一个项目。以下是目前已经完成、上线的几个:1️⃣ 科技博客这个是我最早上线的一个博客,主要记录自己折腾 AI、软件开发、互联网工具的一些心得体会。 很多技术细节、踩过的坑,未来希望能积累成一个对他人有用的“避坑指南”。2️⃣ 生活博客这是我个人的生活记录博客,内容更自由随性,涵盖投资理财、家庭教育、旅行见闻等。 它也见证了我在不同阶段对生活、工作的思考变化,算是一个半公开的“人生备忘录”。3️⃣ 葡萄牙语学习网站这是最近上线试运行的一个产品,我个人对它还
📌 背景我一直使用 Obsidian 编写 Markdown 文件,并配合脚本将内容自动发布到 Typecho 博客中,实现写作与发布的无缝整合。 整个流程包括:在 Obsidian 中编写 .md 文件使用脚本自动将 .md 转换为 HTML 或内容片段并通过接口发布到 Typecho发布后在博客首页中自动展示文章及封面图一切都很顺利,直到我发现 首页有些文章封面不显示了,甚至页面布局错乱。🕵️ 问题分析经过排查,发现问题出在:如果 Obsidian 的 Markdown 中插入了视频链接(如 .mov 文件),自动生成的封面图提取逻辑会错误地把 .mov 当成图片来显示。而首页模板会这样写:<img src="xxx.mov" />👉 这在 HTML 中是非法的,浏览器无法渲染视频为图片,导致封面图加载失败。🔧 根本原因主题中负责提取封面图的函数如下(原始版本):function getFirstImageFromContent($content) { $output = preg_match_all('/<img.+src=&quo
您的浏览器不支持视频播放。今天我试用了谷歌新发布的视频编辑AI。果然和我几天前猜的一样,现在已经下放到Pro套餐了。您的浏览器不支持视频播放。每次智能生成的视频时长是八秒。晚上我专门体验了一下。您的浏览器不支持视频播放。最明显的感受是:Pro版提供的时长还是太短了。您的浏览器不支持视频播放。很多内容还没交代清楚时间就到了。不过,视频中的内容还是比较丰富的。您的浏览器不支持视频播放。但有个明显的问题,就是对中文的支持不太好。我输入的中文关键词会直接识别成英文或者被略去。您的浏览器不支持视频播放。如果强行让它用中文,又经常会出现乱码。使用英文显示就会正常。您的浏览器不支持视频播放。这一点用下来,体验确实不太理想。此外如果对其中人物如果不强调外貌,默认肯定都是外媒记者了。您的浏览器不支持视频播放。希望后续版本能有所改进吧,放出更多的时长,做更好的中文支持。
程序员大利好!这款AI编辑器提供三个月的会员免费。最近超火的AI编程神器正在搞活动,可以免费申请三个月的会员!我已经上车啦,今天就来给大家安利一下这款编辑器到底有多神!简单来说,这是一款集成了强大智能代码编辑器。你可以把它想象成一个开了挂的集成编程工具,它不仅拥有你熟悉的所有功能和操作习惯,更在此基础上,深度融入智能化,让你的编程效率直接起飞!我已经成功申请了三个月的免费会员,可以无限制地体验它所有的强大功能,包括多个主流模型。如果你也想体验一下编程的快感,大幅提升你的开发效率,赶紧去搜索链接,早点注册早点享用。
刚刚结束的Google二零二五大会,谷歌这次几乎是用AI把自家所有产品都给重构了一遍!谷歌这么一升级,好家伙,直接把我给整不会了!以前我还是坚定的OpenAI使用者。现在两边都这么猛,功能一个比一个强大,这选择困难症都要犯了!到底用谁家的AI?只是目前谷歌最新推出的功能需要最高套餐的订阅,虽说现在半价优惠,可一个月900块的订阅费还是有点肉疼。我还是先整个Pro版用起来。毕竟,科技发展这么快,说不定过段时间,那些酷炫功能就下放到Pro版了呢。
对比gemini和openai,gemini几千字的文字毫不吝惜的输出给你,相比而言openait就偷懒了很多。不过chatgpt的绘图能力还是很想强的无法割舍,一幅墙壁上的不太清晰的画作,openai能读懂并复刻一幅同样主题的画出来。复原出中国木版画的风格和原作所要表达的意思。而且可玩性确实强,同样的主题轻松切换为3D的粘土风格画。
walker
万事随性而为,因好而研,因趣而学,从心所欲。脱离依赖,谋划将来,避免经济之险,迈向希望之光。