0xFE

运维之道 本站总阅读量

置顶 值得研读的一些文章集合

持续更新中,本页面仅供参考。 kernel 设计 文章链接 内容简介 推荐原因 Linux I/O 原理和 Zero-copy 技术全面揭秘 Zero-copy的方案介绍 介绍了mmap,sendfile等技术的发展 内存 文章链接 内容简介 推荐原因 Hack The Virtual Memory: C strings & /proc malloc......

置顶 身份认证和HTTPS证书校验

通过例子告诉你https证书的校验过程,原创 HTTPS解决什么问题 HTTPS解决两个问题: 加密传输 保证客户端和服务器之间的信息不是明文传输,保证信息的机密性 身份认证 HTTPS协议能够证明服务端的身份,防止假冒网站冒充自己的身份。 对称加密算法 这一部分需要密码学的基础,本段仅做相关总结。 对称加密因为密钥只有一个,存在密钥被枚举出来的问题,加密安全性不够高......

关于MSS的一个小疑问的思考

关于MSS的一个小疑问的思考 @laixintao大佬的一片文章有关 MTU 和 MSS 的一切 | 卡瓦邦噶!中的疑问,为什么当TCP两边的MTU一大一小时,两边都使用最小值来发数据,例如: A mtu1500,B 800,实际双方都使用800,如果B使用1500来发不更高效吗? 分析 A -> B: 为了B能收到,只能使用800,这个方向没有什么疑问 B -> A: 一开始......

[备忘]协议栈相关图解

...

[记录] 没关注过的tcp keepalive序列号

业务报障过来,从client抓包如下,故障现场中没有抓到整条流,只抓到了如下部分: 通过wireshark的提示,有重传,而且有acked unseen segment的提示,以为是server返回的ack不对导致的一直卡住的现象。 解释: 上面No为[13,14]和[25,26] 4个包为TCP keepAlive包,心跳包的特点是seq为上一个服务端(对端)发来的ack号减1,本cas......

[转载]Devops中的Overfitting

原文 https://www.kawabangga.com/posts/4145 在运维工作中,很多人都在宣扬自动化,经过几年的工作,我发现这种自动化在某些地方有些极端了。devops 崇尚自动化,但并不是一味的自动化。有一些事情是适合手工操作的,过度的自动化会浪费跟多的成本,只能得到很少的收益。 就好像一台电梯,用古老的电梯算法运行了很久,但是有一天有人觉得这个电梯运载能力没有发挥到极......

[转载]聊聊SRE的日常工作与发展方向

聊聊SRE的日常工作与发展方向 有很多人问过我想了解一下 SRE 这个岗位,这是个很大的话题,在这篇博客中把想到的一些介绍一下吧。 SRE 到底是什么?这是一个最早由 Google 提出的概念,我的理解是,用软件解决运维问题。标准化,自动化,可扩展,高可用是主要的工作内容。这个岗位被提出的时候,想解决的问题是打破开发人员想要快速迭代,与运维人员想要保持稳定,拒绝频繁更新之间的矛盾。 SRE ......

内核中的随机端口选取

connect和bind0 socket通信中,客户端需要选取随机端口和服务端进行连接。通常情况下,使用相关的系统调用即可,相关函数中会实现选取随机端口的逻辑。比如TCP使用connect()来连接,UDP使用sendto()来连接。另一种方法是使用bind(0)进行随机选择端口。 随机端口选取测试 getRandomPortConnectTest.c,使用connect系统调用: 1234......

2020总结

今天3号,元旦假期的最后一天结束。明天迎来2021年的第一个工作日,今晚探亲回家路上,回忆一年来的经历,以简笔记之,供日后回忆。 读书和电影 书籍: 《非暴力沟通》 《苏东坡传》 《性能之巅》 今年预计多花点时间看看书~ 电影和电视剧: 《八佰》 《1917》 《金刚川》 《一秒钟》 《隐秘的角落》 今年的电影和电视剧相对来说比较经典,上面的几部都是比较好看的电视剧~ 购物 主要记下今年购买......

凌晨一小case排查心路历程-CPU相关

现象 有几个cpu.core idle 两分钟从100直接降到0 机器ssh登陆hung死,无法进入机器查看 cpu.load 很高,几乎到200多,cpu才20core,远远超过CPU core num. 故障时现象监控图: 几个core的idle直接降为0 通过查看iowait,时间点能对应,也就是因为iowait被占用100% 查看下机器全局load: 经验分析 出现CP......