Sutdown Blog

「我相信我的命运因我的选择而转动着」

大模型原理:从transformer到llm

0 前言 这篇主要作用是学习笔记. 大部分都是来源于该项目datawhalechina/happy-llm: 从零开始的大语言模型原理与实践教程. 该篇仅包括上述项目前四章的部分,主概念。 前四章主要讲述ai的发展, 从最初的transformer架构,到预训练语言模型,,到如今的大语言模型。后三章则侧重于实现,比如如何搭建一个大模型,模型如何训练微调,大模型的评测,大模型Agent等...

Langchain到简单Agent

0 AI相关基础概念 LangChain 是一个用于开发由大型语言模型(LLMs)驱动的应用程序的框架。 生成式AI:使用大模型进行支持,在大量原始未标记的数据基础上对于深度学习模型进行预训练,从而让机器能够理解语言甚至图像,能根据需要自动生成内容。 大模型的训练阶段:预训练(提升本身的知识量),SFT(Supervised Fine-Tuning监督微调,专注于选择某一方面...

不同语言的并发编程

前言:基于各语言介绍一下对于并发的使用,也会穿插些语言的基础特性,适合编程萌新看,更侧重于广度,会结合代码展现。 并发编程基础介绍 古早的历史介绍,可以看看这篇万字详解并发编程!!!-阿里云开发者社区。 并发编程三要素 原子性:一个或者多个操作要么全部执行成功要么全部执行失败。 有序性:程序执行顺序按照代码顺序先后执行,但是CPU可能会对指...

cuda安装和入门使用

CUDA工具包: 选择cuda版本时,注意先在NVIDIA中看电脑显卡支持的CUDA版本。 完整的 CUDA 开发工具集,包含编译器、库、驱动等,提供 CUDA 开发环境(编译 CUDA 代码、运行 CUDA 程序)。 CUDA安装教程(超详细)-CSDN博客 1 2 3 4 5 6 C:\Users\name>nvcc -V nvcc: NVIDIA (R) Cuda com...

海量数据处理

1 如何在两个大量的文件中找到相同的部分? a和b两个文件,各自存放50亿个URL,每个URL占64B,内存限制为4G,请找出a,b两个文件共同的url。 2^10 10^9 a,b文件大小为320GB 分治+堆+哈希 将a,b大文件拆分为多个小文件。该过程利用相同的哈希规则让url映射存放到某个文件之中,这样能够保证a和b中相同的url映射到相同的文件之中。拆分的过...

二分查找详解

二分查找详解 写法一: 35. 搜索插入位置 - 力扣(LeetCode) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 int searchInsert(vector<int>& nums, int target) { int left = 0, r...

AI代码审查 - 关键点优化

InferenceAI 模块目的 inferenceOpenAI 模块在本项目中的核心目的是作为 AI 服务的接口层,封装 API 调用细节,支持大规模并行的代码评审流程。它需要处理高并发请求、管理资源使用、确保调用稳定性,并为上层业务逻辑提供简洁的接口。该模块封装了与 OpenAI API 的交互逻辑,提供了两种调用 AI 服务的方式: 普通调用 (inferenceOpenA...

AI代码审查

第一期 单线程 整体框架结构 背景:在提测提交代码时,利用AI模型对代码的改进提出建议。该工具主要用于对当前的结果进行定量分析。 整体分为两部分,数据集执行和结果评估。 数据集执行的作用在于针对input code给出AI预测的结果 模型评估的作用在于将AI预测结果和真实结果进行比对 数据集执行中分为三部分,check,reflect和review。其中每部分都可以选择不...

QA测试

0 业务 骑行服务业务的四个领域 用户流程体验:找还用,首页/红条/面板,结费页等 用户开关锁体验:开关锁链路,状态机,骑行安全等 用户骑行合规:合规引导,合规判定,策略管理等 用户基础服务:骑行账号维护,用户协议,第三方账号打通等 1 需求评审 业务性需求:关注业务场景和功能实现,预估改动后的场景通过手工用例和自动化用例能否实现全覆盖。 技术性需求:关...

2025.五月小记

哈喽让我想想要怎么向你描述这个月呢 相比较上一次实习的生疏,这一次的你显得更加的游刃有余,虽然依旧出现了一些问题,不过你依然并不是很慌张,毕竟问题终究都会有个结果的。这段时间你也结识了很多人,比如实习中的同事,合租的舍友等等。从前的朋友也还存在着交集,新朋友的相处看着也还不错,一切你应该都是很称心如意的。这样子说的话,那变化最多和最让你感到心慌的就是生活方式的转变了。每天见到的人变多,加上...