分类技术专业下的文章 - 自由翱翔：十年学习成长之路

chatgpt推送了新的大模型

今天早上，我发现ChatGPT悄悄更新了新的o1-preview和o1-mini模型，尽管之前并未抱太大期望，但我的账户还是收到了推送。尽管现在使用额度限制很厉害，一个月使用50次和30次，等找一个重要且复杂的任务，让它跑一下。这个版本在推理方面有了大幅度的提升。

技术专业 · 2024-09-13

telegram免费图床停摆，调整后利用2T网盘实现图床存储。

免费服务停掉了：博客图片存储中断的经历最近我的博客网站遇到了一个突发问题，导致我不得不紧急修复。起初，我的网站使用的是学校活动提供的服务器，流量配额相对有限。为了最大化减少流量使用，我选择将所有图片存储在站外服务器上，避免对主服务器的流量产生额外的负担。为了解决站外存储空间的成本问题，我采取了一种较为独特的方案——使用 Cloudflare 加速，并结合 Telegram 作为图片存储空间。通过 GitHub 上的开源工具 Telegraph-Image，我可以轻松地将图片上传到 Telegram 的 Telegraph 服务上，而不需要付出太多额外的成本。为了保证安全，我还参与了这个工具的改进工作，增加了对上传域名的限制，防止滥用上传机制。同时，我也利用 Obsidian，实现了图片的自动上传和博客的快速发帖。这个自动化流程极大提高了我的工作效率，使用体验非常丝滑。几乎每天，我都能顺利地通过这个流程来管理我的博客内容。然而，在周五的晚上，一切都突然中断了。每次我尝试上传图片时，都会出现报错。这个突发问题让我十分焦虑，于是我立刻到相关的讨论群中寻找答案，结果发现很多人和我遇到了同样的问

技术专业 · 2024-09-07

将whisper封装为API服务支持远程调用

背景目前nas负责处理音频转为文字，由于没有gpu稍微长一点的音频就需要处理几个小时。将一台装有4060显卡的台式机中的whisper通过api服务的方式提供出来，提供nas调用。封装编写一个FastAPI应用，将Whisper模型包装成API接口，并且能够处理外部传入的音频文件请求。from fastapi import FastAPI, UploadFile, File, HTTPException, Form import whisper import os app = FastAPI() # 加载Whisper模型，这里使用 medium 模型 model = whisper.load_model("medium") @app.post("/transcribe/") async def transcribe_audio( file: UploadFile = File(...), language: str = Form(...), # 接收语言类型参数 initial_prompt: str = For

技术专业 · 2024-08-25

周末部署ragflow，构建自己的知识库

概述周末在家用电脑上部署了开源的ragflow，选择这个是考虑它支持ocr自动识别，另外还准备安装的是quivr（号称第二大脑），待安装后再做比较。什么是RAG概念：RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索与生成模型的技术，用于提升自然语言处理任务的性能，特别是在问答、内容生成等领域。过程：大语言模型（LLM, Large Language Model）：大语言模型是通过大规模数据训练而成的深度神经网络模型，如 GPT-4。它们可以生成自然语言文本，并具备广泛的语言理解能力。检索（Retrieval）：在 RAG 中，检索指的是从外部知识库中找到与输入查询相关的信息或文档。这个步骤的目的是弥补大语言模型在生成过程中的知识盲点，尤其是当涉及到事实性问题时。生成（Generation）：在获得检索到的相关信息后，模型会基于这些信息生成答案或文本。这一过程利用了大语言模型的强大生成能力，同时避免了仅依赖模型本身知识库的局限性。工作流程：输入查询：用户提供一个查询或问题。检索阶段：系统会从预先构建的知识库中检索与该查询最相关的文本

技术专业 · 2024-08-25

周末部署ragflow，构建自己的知识库

一个公式搞清楚运行不同的大模型需要多少 GPU VRAM？

一个非常标准的计算公式，了解 LLM 和 GPU VRAM 换算规则，下次发新模型就知道本机能不能跑了。

技术专业 · 2024-08-19

一个公式搞清楚运行不同的大模型需要多少 GPU VRAM？

构建第一个卷积神经网络模型的实践指南

说明本文根据《# A Hands-on Guide to Build Your First Convolutional Neural Network Model》翻译整理。概述本文将简要讨论 CNN，这是一种专门为图像相关任务设计的神经网络的特殊变体。本文将主要围绕CNN的实施部分进行介绍。我们已尽最大努力使本文具有交互性和简单性。希望你喜欢它。祝您学习愉快！！介绍卷积神经网络由 Yann LeCun 和 Yoshua Bengio 于 1995 年引入，后来被证明在图像领域显示出卓越的结果。那么，与普通神经网络相比，当应用于图像域时，是什么让它们与众不同呢？我将用一个简单的例子来解释其中一个原因。考虑到您的任务是对手写数字的图像进行分类，下面给出了一些来自训练集的样本。如果你正确地观察，你会发现所有的数字都出现在各自图像的中心。如果测试图像是相似的类型，则使用这些图像训练普通神经网络模型可能会产生良好的结果。但是，如果测试图像如下所示，该怎么办？在这里，数字 9 出现在图像的一角。如果我们使用一个简单的神经网络模型来对这个图像进行分类，我们的模型可能会突然失败。但是，如果将相

技术专业 · 2024-08-17

构建第一个卷积神经网络模型的实践指南

将whisper部署到nas中，后台自动进行音频转文本的处理

背景今天的项目非常简单，就是将刚刚编写的，将obsidian下whisper目录中的音频文件自动转写为markdown的文本内容。代码编写非常简单，按照官网给出的python样例进行简单改写就可以了。但是在nas上安装whisper却遇到了问题，主要就是root、tmp下的空间不足带来的各种报错。环境安装问题1.创建虚拟环境cd /volume1python3 -m venv whisper_envsource whisper_env/bin/activate2. pip3执行中指定目录mkdir -p /volume1/tmp/pip_cacheXDG_CACHE_HOME=/volume1/tmp/pip_cache TMPDIR=/volume1/tmp pip3 install openai-whisper按照这个方式安装终于成功：程序执行问题在开始进行程序执行的时候再次遇到存储空间不足的问题：应该是程序执行中需要下载whisper模型，但是nas中的空间出现不足。采取将whisper用到的目录连接到比较大的空间中的方式。首先，确保目标目录存在mkdir -p /volume1

技术专业 · 2024-08-10

将whisper部署到nas中，后台自动进行音频转文本的处理

podsync Docker 服务出现无法自动更新问题

内容摘要: podsync Docker 服务由于无法自动更新，导致无法获取最新的资讯。经过排查，发现此问题不是个别问题，而是 Google 的封堵导致的。目前暂时将 podsync 停用，等待后续探索替代方案。问题描述podsync 这个 Docker 服务是我非常喜欢的一个应用，每天早上开车上班的路上，使用该服务听取资讯已经成为习惯，但现在却无法顺利获取最新资讯。排查过程经过重启和 github 上查询相关问题，发现此问题并非个别现象。随后，发现 Google 进行了封堵导致的影响。停用暂时将 podsync 停用，等待后续探索替代方案。持续关注 podsync 的更新: 等待 podsync 团队解决该问题，并恢复服务。

技术专业 · 2024-08-10

podsync Docker 服务出现无法自动更新问题

今天新安装了一个obsidian的AI插件：Smart Connections

摘要今天在obsidian中安装了Smart Connections插件。Smart Connections 是一个为 Obsidian 设计的 AI 驱动的插件，它能够让用户通过 AI 嵌入式技术与笔记进行交互式聊天，并自动发现与当前笔记相关的内容链接，同时支持本地模型和超过 100 种不同的 API 模型，如 Claude、Gemini、ChatGPT 和 Llama 3。使用体验我使用的是llama-3.1-8b-instant模型，可以支撑通常的对话，比较好用的是可以基于我之前发表的文章进行内容总结。例如关于骑行的总结：关于投资的总结自定义服务器如果直接使用openai的api配置比较简单，但是在使用自定义的one api的自建服务的时候总是报错，插件给出的提示信息也非常的简单，检查发现需要按照标准的三段配置方式进行配置按照下面的配置可以正常使用：网络介绍Smart Connections 是一个为个人用户设计的软件，旨在通过 AI 技术增强个人的笔记管理和知识发现能力。该插件支持本地 AI 模型和多种 API 模型，如 Anthropic 的 Claude、Google 的

技术专业 · 2024-08-08

今天新安装了一个obsidian的AI插件：Smart Connections

优化typecho的接口服务解决自动发帖后无法正常编辑的问题

引言我对自己搭建的基于Obsidian的文档编辑小平台非常满意。得益于Obsidian便捷的写作方式，我可以随时随地记录下想到的事情，不论是在单位、家里，还是在路上。随后，在有时间的时候，我会将这些内容整理完整，通过后台的文件同步实现分类发布。多平台同步 Blog目录：当我将文章放入到Blog目录中后，家中的NAS中的Python程序会自动将文章同步到我的博客空间中。 DayOne目录：将文章放入DayOne目录后，会自动发布到DayOne这款App中，实现内容的私密存储。 Media目录：如果将文章放入Media目录，则可以实现将Markdown文件转换为视频，方便发布到各大平台中。完美中的不完美然而，令我困扰的一点是，当Markdown文件同步到Typecho博客中后，支持Markdown的编辑器中会充斥着大量的HTML文字，导致无法在网站上进行二次编辑。问题的解决今天，在给网站安装访问记录器的过程中，我无意中发现了设置中可以配置通过XML-RPC接口提交时保持Markdown格式而不转化为HTML的选项。经过修改，这个问题得到了完美解决，内容变得整洁了许多。总结无论是个人私

技术专业 · 2024-08-03

优化typecho的接口服务解决自动发帖后无法正常编辑的问题

Theme Jasmine by Kent Liao