相关文章
LLM推理--vLLM解读
主要参考: vLLM核心技术PagedAttention原理 
总结一下 vLLM 的要点: 
Transformer decoder 结构推理时需要一个token一个token生成,且每个token需要跟前序所有内容做注意力计算(包括输入的prompt和该token之前生成的token…            
建站知识
2025/11/4 14:58:00
Ubuntu22.04如何设置linux-lowlatency核心
在Ubuntu上设置 linux-lowlatency 内核可以帮助减少系统延迟,适合需要低延迟环境的任务(如音频处理、实时应用等)。以下是设置步骤: 
1. 更新系统 
首先,确保系统是最新的: 
sudo apt update
sudo apt upgr…            
建站知识
2025/11/4 15:04:10
Java进阶--IO流
一、File类 
概念:代表物理盘符中的一个文件或者文件夹。 
常见方法 
方法名 
描述 
createNewFile() 
创建个新件。 
mkdir() 
创建个新录。 
delete() 
删除件或空录。 
exists() 
判断File对象所对象所代表的对象是否存在 
getAbsolutePath() 
获取件的绝对路径 …            
建站知识
2025/11/4 15:03:58
kakailio官网推荐的安装流程ubuntu 22.04
https://kamailio.org/docs/tutorials/6.0.x/kamailio-install-guide-git/ 
# 非必须项
wget -O- https://deb.kamailio.org/kamailiodebkey.gpg | gpg --dearmor | sudo tee /usr/share/keyrings/kamailio.gpg在/etc/apt/sources.list文件追加以下内容 
deb [signed-by/usr/sh…            
建站知识
2025/11/4 14:56:01
java中的锁面试题
1、多线程中 synchronized 锁升级的原理是什么? 
synchronized 是JVM层面的锁,是 Java 关键字,通过 monitor 对象来完成,synchronized 的实现涉及到锁的升级,具体为无锁、偏向锁、自旋锁、重量级锁 synchronized 锁升级…            
建站知识
2025/11/4 14:56:34
体验 DeepSeek 多模态大模型 Janus-Pro-7B
含有图片的链接: https://mp.weixin.qq.com/s/i6kuVcGU1CUMYRPDM-bKog?token2020918682&langzh_CN 
继上篇文章下载了 Janus-Pro-7B 后,准备本地运行时发现由于电脑配置配置太低(显存小于24G),无法运行࿰…            
建站知识
2025/11/4 13:38:48
机器学习之数学基础:线性代数、微积分、概率论 | PyTorch 深度学习实战
前一篇文章,使用线性回归模型逼近目标模型 | PyTorch 深度学习实战 
本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started 
本篇文章内容来自于 强化学习必修课:引领人工智能新时代【梗直哥瞿炜】 线性代数、微积分、概率论 …            
建站知识
2025/11/3 16:28:02
rocketmq架构
1.架构图  RocketMQ的四层架构: 
1.1 客户端层(Clients): 
Producer集群: 
(1)DefaultMQProducer:普通消息生产者 
(2)TransactionMQProducer:事务…            
建站知识
2025/11/3 1:38:08

