注意!在使用以下方法之前,请先安装好anaconda,并在环境变量中配置好环境变量(windows)。 知晓conda create -n和conda activate命令的用法。 未掌握者请前往CSDN自行学习相关知识后再阅读此文。 在使用conda时,建议使用Anaconda Prompt,而不是cmd。 在国内安装cuda版本的torch是一个令人头痛的问题,pip安装使用镜像源加速的方法也不尽人意。在此,参考各种方法后认为使用whl文件安装的方法最快。点击网址,我这里下载的cu118版本的,如果你需要其他的cuda版本,请回到上级目录选择cuda版本。 注意!如何知晓自己的cuda版本?如果您的显卡为集显或非NVIDIA显卡,您不能安装cuda版本,请安装cpu版本。 查看自己的cuda版本的命令:nvidia-smi 如果cuda版本 >= 11.8, 您可以选择cu118版本(cuda是向下兼容的)。否则,请安装更低版本。 我的环境是如下:操作系统:windows10虚拟环境:anacondapython版本:python3.10cuda版本:12.7所以我选择了torch-2.3.1+cu118-cp310-cp310-win_amd64.whl文件。 注意!cu118代表cuda11.8版本,cp310代表python3.10版本,win代表windows平台。请根据自己实际情况选择适合自己的whl文件。 如何查看自己的python版本?在cmd中输入python --version或python -V即可。 点击后会在浏览器下载,如果你的速度是KB级的,那说明这个方法不适用你。MB级是比较令人满意的速度。下载后,使用pip安装。先到文件下载的目录下,激活你的环境,然后安装whl文件: 注意!请一定要在文件下载的目录下安装,或者使用文件的相对地址或绝对地址安装。pip install torch-2.3.1+cu118-cp310-cp310-win_amd64.whl -i https://pypi.mirrors.ustc.edu.cn/simple/在安装torch时需要下载其依赖库,如numpy。亲测pip在安装依赖项时科大源最快。看到最后successfully installed后,就说明我们安装成功了。接下来测试一下:返回True, 说明安装成功。torchvision等其他包同理参考网址 python如何安装各种库——pip, whl 和 tar.gz 最全安装方法 使用国内镜像解决torch-cuda太慢问题 https://mirrors.aliyun.com/pytorch-wheels/cu118/
笔记:类脑与认知计算
1. 绪论 主体 结构 功能 计算机 硬件 软件 脑 神经元 认知加工 类脑(结构) 认知(功能) 类脑 + 计算 -> 类脑智能 认知 + 计算 -> 认知智能 智能 心理能力 从经验中学习的能力 理解和处理抽象概念的能力 使用知识操纵环境的能力 适应环境的能力 认知 指人们获取知识和应用知识的心理过程 计算 广义计算:信息加工系统具有可计算性 认知过程是否可计算 心智哲学中的功能主义 功能主义认为人类心智的物质载体时大脑 心智时人脑的一种功能属性 人脑类似于计算机 心智可计算理论 心智不仅包括认知,也包括意识现象以及人的主观感受性等。...
笔记:自然语言处理
1. 绪论自然语言处理- 能够理解自然语言的意义(NLU)- 能够生成自然语言(NLG)符号学派和随机学派 ACL: CCF A Sequence-to-Sequence 方法 自然语言处理中的S2S(Sequence-to-Sequence)方法是一种用于处理序列数据的深度学习技术,特别适用于自然语言处理任务,如机器翻译、文本摘要和对话生成。 基本概念: S2S方法由两个主要部分组成:编码器(Encoder)和解码器(Decoder)。 编码器将输入序列转换为一个固定长度的上下文向量。 解码器从该上下文向量生成输出序列。 工作流程: 编码阶段:输入序列通过编码器,通常由RNN、LSTM或GRU组成,将信息压缩到上下文向量中。 解码阶段:解码器接收上下文向量,并逐步生成输出序列。 注意力机制: 注意力机制允许解码器在生成每个输出时,动态地关注输入序列的不同部分。 应用场景: 机器翻译、文本摘要、对话生成等。 优势与挑战: 优势:处理变长输入和输出,适应性强。 挑战:需要大量数据和计算资源,长序列处理具有挑战性。 自然语言处理的主要难点 语音歧义 词语切分歧义 语义歧义 语用歧义 结构歧义 指代歧义 省略歧义人工反馈式强化学习RLHF困惑度困惑度(Perplexity)是衡量语言模型性能的一个重要指标,反映了模型对文本数据的预测能力。困惑度越低,表示模型对数据的预测越准确。概念 困惑度是语言模型对测试集的平均不确定性的一种度量。 它是测试集上交叉熵的指数形式,表示模型在预测下一个词时的平均选择数。计算过程 对于一个给定的语言模型,困惑度可以通过计算模型在测试集上的平均对数似然来得到。 公式为:\(\text{Perplexity} = 2^{-\frac{1}{N} \sum_{i=1}^{N} \log_2...
cursor AI 编程
未来的每一个程序员都应该是一名优秀的产品经理。 默认读者会安装cursor和使用vscode、markdown。核心功能:Chat和Composer @功能菜单 / 拖拽使用如何向AI提问? 让AI复述需求指令(确认AI明白我的需求) 明确需求辐射范围(在Cursor输入框内明确辐射范围) 需求拆解(把需求一条条描述用列表发送) 把AI当成一个小孩子,尽可能逻辑清晰,将自己的解决思路提供给AI,可以给一些示例参考Cursor整体使用思路 明确需求。现在Chat模式中,先向AI描述需求,想做什么事情,让AI对你的需求有一个基础了解,然后去问AI如果想要完成自己的需求,可以选择哪些方案,并且可以让AI阐述一下各个方案的优缺点。 选择对应的方案之后,可以在Composer中重新编辑需求,在AI在你的需求和方案框架内生成代码。合理使用Notepad维护更新旧的项目 让cursor检索整个项目,帮你生成一个.cursorignore文件;在.cursorignore中编辑,添加你想要索引忽略掉的文件;打开设置,点击Feature,去Codebase indexing下面点击Resync Index 把项目相关的一些需求文档、接口文档、开发相关的一些技术文档,全部录入到Docs里以作备用 在项目根目录中,新建一个.cursorrules文件,并且去设置你的项目规则(Markdown格式为由)(不会写可以让AI检索Docs后自己生成一个.cursorrules文件,之后自行修改即可) 新的需求到来时,先与Chat沟通将需求理解透彻,然后创建一个Notepad,在Composer中@这个Notepad生成代码如需了解更多内容请观看参考视频↓(墙裂推荐!)参考视频:普通人也可以看的 AI 编程指南 | Cursor 教程|Cursor 使用技巧和思路|如何免费使用 Cursor|AI 编程
docker私人仓库搭建方案指南
Docker仓库之Registry私有镜像仓库的搭建与使用可能遇到网络问题,加入代理:【云原生Docker | 报错01】大力出奇迹,解决docker_Error response from daemon_Get “https://registry-1.docker.io/v2/“并行下载镜像:Linux:echo "ubuntu:20.04 alpine:latest nginx:latest redis:latest mysql:5.7 postgres:13 python:3.9 node:14 openjdk:11" | xargs -n 1 -P 4 docker pull
mac中 command not found 解决方案(go install 为例子)
在mac中使用go install下载工具后,使用cil使用工具会出现command not found提示。使用网上各种方案后,总结可能的通用方案。 使用命令 go env 查看go环境,找到GOPATH一栏(go install的内容会放在该目录下) 为了更具体到了解到GOPATH里存的是什么,我们cd看一下可以看到bin目录下有我们下载的命令(如果下载成功) 将bin目录写到我们的PATH中,我这里使用的是zsh的配置文件: vim ~/.zshrc 然后写入 PATH=$PATH:/Users/mac/go/bin 之后重新载入.zshrc,就可以全局使用命令了source ~/.zshrc
卷积核中的计算
补充知识1x1卷积核的作用1x1卷积核的作用是将输入的特征图中的每个像素点都与一个固定的权重相乘,然后将结果相加得到一个新的特征图。(线性组合) 参考资料 https://blog.csdn.net/Strive_For_Future/article/details/82350206 https://blog.csdn.net/qq_37717661/article/details/86596929 https://blog.csdn.net/xuerishun/article/details/122804750
invalid character '-' in numeric literal错误
笔者在做软件工程大作业时遇到了这样一个问题:invalid character '-' in numeric literal错误经笔者检查,错误原因为:前端向后端发送的是from-data格式,后端写的逻辑是把前端发过来的信息当做JSON格式解析,所以就一直错,格式不匹配。只需要把这个’Content-Type’从’application/form-data’改成’application/json’.参考文献 https://blog.csdn.net/csde12/article/details/121764104
