avatar
Articles
94
Tags
53
Categories
34

Home
Archives
Tags
Categories
Link
About
Blogs
Home
Archives
Tags
Categories
Link
About

Blogs

使用acme.sh获取证书
Created2024-11-04|server
官网地址官方的地址是 acmesh-official/acme.sh 如何安装 acme.sh官方的安装方式是 1curl https://get.acme.sh | sh -s email=my@example.com 在国内如果因为网络环境安装失败,可以参考官方的教程Install in China · acmesh-official/acme.sh Wiki 记得在你的 ~/.bashrc 里面加一条 alias acme.sh=~/.acme.sh/acme.sh 这样就可以直接使用命令 acme.sh 来调用了 如何申请这里我开始尝试直接用命令 1acme.sh --issue -d mydomain.com --nginx 来申请证书,但是它告诉我我的 nginx 配置有问题,查阅英文版本的readme发现,应当使用命令 1acme.sh --issue -d www.ericli.vip --nginx /etc/nginx/nginx.conf 这样就可以正常获取了,但是这时候我遇到了一个问题,之前我用的是 certbot 来获取证书,这玩意需要 sudo 权限, ...
Application Layer
Created2024-11-03|Network
HTTP HTTP 的全程是超文本文件传输协议,即 HyperText Transfer Protocol 用于传输网页等超文本信息。 一个常见的网页(Webpage)主要由以下的东西组成: HTML文件 JavaScript脚本 CSS层叠样式表 JPEG等其它资源文件 而HTTP的主要功能就是向客户机正确提供这些文件 URLURL是输入在浏览器里面用来访问互联网资源的地址,其格式形如: 1http://www.someSchool.edu/someDepartment/picture.gif 这里面主要包含一下几个部分: http:// 指明协议,可能包含 http 、https 等 www.someSchool.edu 被称为hostname即主机名,是指提供该服务的主机名称 someDepartment/picture.gif 是路径名(Path name) 描述希望获取的资源的位置 这个URL这里是可以整花活的,例如你可以在桌面创建一个 a.txt 的文件,然后在浏览器中输入 file:///C:/Users/Username/Desktop/a.txt 记得把这 ...
Network Overview
Created2024-11-01|Network
Network CoreStore-and-Forward Transmission在这个模式下,每个router会被要求先接收到一个完整的包,再把整个包转发出去,这里给出在 段链接(一共有 个router),每段链接上的传输速率都为 的情况下,传输长度为 的包,产生的端到端的时延为: Hint:为什么这里前面是 是因为,这里最后的client也必须完整收到一个包才能进行处理 FDM and TDMDelay and lossQueuing Delays这里面没啥说的,Queueing Delay 讲的是在每一个router内部,buffer的数量是有限的,所以有可能这个包即使被完全收到也不能马上向前传输出去,可能需要排队等待后面。 Processing Delay这个讲的是,在router收到某个包的时候,需要读这个包的头来判断往哪里转发,所以会产生 process delay Packet LossPacket Loss 讲的是如果这个buffer满了,某些包可能被丢弃。 Transmission Delay 这个延迟是指,一个router在push一个包进入Lin ...
SQL Language
Created2024-11-01|DB
数据类型 符号 数据类型 INT 整数 SMALLINT 短整数 DEC(m,n) 十进制数 FLOAT 浮点数 CHAR(n) 定长字符串 VARCHAR(n) 变长字符串 BIT(n) 定长位串 BIT VARYING(n) 变长位串 DATE 日期 TIME 时间 TIMESTAMP 时间戳 对表的操作创建表创建表的命令是: 1234567CREATE  TABLE  tablename (colname  datatype  [ NOT NULL ]{ , colname  datatype  [ NOT NULL ] }) ; 比如说: 123456CREATE TABLE student (sno CHAR(5) NOT NULL,sn CHAR(20),sd CHAR(2),sa SMALLINT,); 就会创建一张名为 student 的表,有四列,分别为 sno,sn,sd,sa 其中的 sno 不为 null 修改表增加和删除列的操作如下: 12ALTER  TABLE  <基表名>  ADD  & ...
Transport Layer
Created2024-10-27|Network
连接复用UDP: User Datagram ProtocolUDP只用一个二元组来区分链接,一个UDP的头只包括 dest ip 和 dest port 两个信息而在对上面的应用层提供服务的时候,拥有同样的 ip 和 port 的数据块会被送到同一个 Socket 里面 TCPTCP使用一个四元组来区分链接,即(source ip,source port, dest ip,dest port) 这个四元组来区分,只有当这四元组完全相同的时候才会送到同一个 Socket 里面去。 UDP优点和缺点优点 不需要握手建立连接 简单,发送端和接收端没有状态切换 报文头小 缺点 只是尽最大努力传输,所以报文可能会丢失、乱序 没有拥塞控制,可能会严重超时 UDP报文的样式 如何做checksum 可靠的传输这里面东西比较多,只记录怎么评估一个可信传输的效率 定义 表示sender工作的时长站总传输时长的占比,定义传输时间 这里的 表示每一个待发包的大小,而 表示这个Link的传输速率,那么在发送一个包并等待 的这个过程中有 如果使用pipeline,这里的计算就会变成下图: 特殊传 ...
check3
Created2024-10-26|Network
Structure and DesignTimer首先在 TCPSender 里面实现一个 Timer 来实现计时的功能,代码如下: 12345678910111213141516171819202122232425262728293031323334353637383940class Timer{private: uint64_t initial_RTO; uint64_t RTO; uint64_t time_passed_; bool is_running_;public: explicit Timer( uint64_t initial_RTO_ ) : initial_RTO( initial_RTO_ ), RTO( initial_RTO_ ), time_passed_( 0 ), is_running_( false ) {}; bool is_running() const { return is_running_; }; bool is_expired() const { return is_running_ && time_p ...
TRPO
Created2024-10-17|IRL
从动作优势函数说起首先回顾一下动作优势函数,即:这里的优势表示的是在状态 下面选择动作 比选择平均动作的优势 援引一张从知乎文章知乎-TRPO中的图: TRPO起始式的推导TRPO的起点是表达式这里就给出了在策略 的基础上通过采样 来计算 累计回报的优势的计算方法下面来证明这个式子 引入折扣访问频率定义那么 式可以写成:最后一步是交换求和顺序,先对 求和,剩下的就是定义了 Skill oneTRPO的第一个技巧是,每次更新的策略是临近的,换言之 和 的距离是不远的,因此可以直接近似替代,换个写法,那么 式直接可以改写为:
RLHF
Created2024-10-16|IRL
综述这个方法的基本想法就是,我们在强化学习的过程中,可以引入人来打分,避免训练出来的情况不符合预期,更符合实际情况,其大致的流程是: 符号定义这里相比于传统的强化学习是状态-动作,这里假定的环境是在时间 Agent会从环境中观察到 ,并且会选择一个动作 发送给环境 定义一条轨迹的某个片段是由一系列的观察和动作构成的,即 不同于传统强化学习里面环境直接反馈一个Reward回来,这里假设的是人类能够区分不同轨迹之间的优劣,换言之人类能够给出一个偏序,即判定: 评价一个RLHF的算法定量如果说人类给出评价的标准是基于一个可以定量的价值函数 的,即偏序关系 是由产生的那么最后我们只需要看这个Agent是否按照 RL 的标准最大化了 就可以了 定性如果不是能够清晰量化的评判标准,那么就只能靠人类根据感受进行评判了 关于人类选择的记录这里将人类的一个选择记录为 其中的 ,取值分为如下三种情况: 人类认为某个选择更优,则将对应的 置位为 人类认为两个选择等同,则 将独立采样 人类认为不可分辨则该样本不会出现在数据库中最终把所有的数据放在一个数据库 中 如何拟合R ...
KL Divergence and JS Divergence
Created2024-10-14|InformationTheory
KL散度定义假设有两个概率分布 和 ,他们对应的概率密度分别为 和 如果想要用 去近似 则这其中的 KL 散度为: hint 注意KL散度不具有对称性 在离散的情况下面,可以写成: 理解将KL散度展开成两项,有: Hint:为什么最后不是反过来的因为 H(P,Q)自带一个负号 第一项是交叉熵,代表用 去编码 需要的编码长度,所以KL散度可以理解为用Q拟合P比直接使用P需要多用多少信息 JS散度由于KL散度具有不对称性,这里提出JS散度 定义首先设 则如果全部展开,这个式子是:
check2
Created2024-10-13|Network
My name:李冠霖 My NJU ID:221502012 I collaborated with: NAN I would like to thank/reward these classmates for their help: NAN This lab took me about 8 hours to do. I did attend the lab session. Describe Wrap32 and TCPReceiver structure and design. Wrap32: 这个还是蛮简单的,就是要看懂他这里给的是什么意思,首先第一个 wrap 很简单直接加就行了,记得做类型转换就行。第二个 unwrap 最开始我想的是先用 0xffffffff00000000 去 mask 一下这个 checkpoint 把高32位取出来,然后再去凑最近的是哪一个,但是后面发现corner case太多了,不如直接去算最近的是哪一个。首先把减完的 offset 去减去 (1ULL << 32) / 2 保证了一定是在更近的那一半上面,然后直接去看相差了多少个 ...
1234…10
avatar
Eric Li
Articles
94
Tags
53
Categories
34
Follow Me
Announcement
The blog is now under construction
Recent Post
ecole环境安装指南2025-10-27
No title2025-10-26
Python Package Managers2025-10-26
Hydra | python参数配置包2025-06-05
arXiv:1704.01665v4 | Learning Combinatorial Optimization Algorithms over Graphs | NCO论文阅读2025-05-23
Categories
  • AI1
  • Algorithm2
  • Article_Reading1
    • reinforcement_learning1
  • CV1
  • Cryptology5
  • DB3
  • Diffusion1
Tags
InformationTheory notes gitlab-ci server RBT B树 cmake RegularExpression Probability_Theory tools Hydra config DB termux ssl RL Math frp Diffusion git Others co Article OS UV VSCode Cryptology IRL Optimization Network Transformer m路搜索树 Algorithm MySQL CV cpp SQL fla certbot latex
Archives
  • October 20253
  • June 20251
  • May 20251
  • March 20252
  • January 20253
  • December 20245
  • November 20249
  • October 20248
Info
Article :
94
UV :
PV :
Last Push :
©2023 - 2025 By Eric Li
Framework Hexo|Theme Butterfly
蜀ICP备2023025661号-1