0xFE

运维之道 本站总阅读量

置顶 身份认证和HTTPS证书校验

通过例子告诉你https证书的校验过程,原创 HTTPS解决什么问题 HTTPS解决两个问题: 加密传输 保证客户端和服务器之间的信息不是明文传输,保证信息的机密性 身份认证 HTTPS协议能够证明服务端的身份,防止假冒网站冒充自己的身份。 对称加密算法 这一部分需要密码学的基础,本段仅做相关总结。 对称加密因为密钥只有一个,存在密钥被枚举出来的问题,加密安全性不够高......

内核内存分配的基础分析

内核内存分配的基础分析 通常,内存泄漏会发生在用户态,比如开发者使用malloc()分配一部分空间后,使用完后没有通过free()进行回收,那么就会出现内存泄漏问题,导致内存占用越来越大。 如果内存泄漏发生在内核或者设备驱动中,可能应用开发者排查起来相对陌生,那么怎么分析内存泄漏是否是内核或者设备驱动导致的呢? 本文将会通过简单的实验测试流程为你分析内核中内核泄漏,通过systemstap等......

你对指针理解了吗?

想知道对指针的理解怎样?试着看下这道题吧。这个题是我在学习指针的时候测试的,包括指针运算,指针数组,数组指针等易混淆的概念,如果这题能想出结果的话,基本就过关啦! 123456789int main(){ int a = 0; int b = 1; int *c[2] = {&a, &b}; int *(*pc)[2] =......

[译]This is strictly a violation of the TCP specification

本文翻译自cloudflare的一篇文章,描述了服务端socker泄漏停留在CLOSE-WAIT状态,但客户端的FIN-WAIT2状态超时回收并使用该socket新建立连接,导致出现Connection TIme Out的情况。因现象和backlog溢出现象有点类似,遂将本文的翻译转载到本博客中,和读者一起进步。 补充,我在最后补充了自己的测试复现,在测试中,没有复现出文中的现象,最终测试的......

Perf:Linux下性能分析工具

简介 Perf全名是Performance Event,是在Linux 2.6.31以后内建的系统效能分析工具,依靠perf,应用程式可以利用PMU (Performance Monitoring Unit), tracepoint和核心内部的特殊计数器(counter)来进行统计,另外还能同时分析运行中的核心程式码,从而更全面了解应用程式中的效能瓶颈。 perf基本原理是对目标进行取样,纪......

使用packetdrill模拟Challenge-ACK

背景 packetdrill 在 2013 年开源,在 Google 内部久经考验,Google 用它发现了 10 余个 Linux 内核 bug,同时用测试驱动开发的方式开发新的网络特性和进行回归测试,确保新功能的添加不影响网络协议栈的可用性。 github地址 使用参考文章 Challenge-ACK定义: Linux 内核对于收到的乱序 SYN 报文,会回复一个携带了正确序列号和确认号......

中断亲和性和进程亲和性配置-Nginx

本文准备总结下平时工作中用到的CPU亲和性设置,主要是把用到的配置和验证方法总结起来。因为之前刚接触的时候总是这一篇那一篇的查找文章,遂以Nginx设置亲和性调优来举例,希望新手看到这篇文章能有所帮助。 性能优化目标为下图: 网卡RSS 关于网卡相关的调优,可以系统的学习下这两篇文章Linux 网络栈监控和调优:接收数据,深入了解10G网卡 查看网卡多队列: 123456789101112......

ftrace初识和short-live进程查看

ftrace初识 和 short-live进程查看 ftrace 也就是 function trace,对内核debug 或者 问题排查,性能优化的时候可以用到。刚接触,遂记录于此,是Linux 内核提供的一个debug接口框架,有很强大的功能,希望以后能通过此工具解决实际问题。 本文记录下ftrace的相关基础内容,并简单的应用,来查看服务器上的瞬时进程,也就是short-live进程。 ......

NUMA架构相关总结

背景 工作中接触到DPDK相关知识,在提高DPDK性能上,使用NUMA架构是一个调优点,之前日常运维的过程中也了解过NUMA相关的运维知识,遂总结本文供自己参考。本文主要参考《NUMA架构下的性能挑战》演讲,以及互联网上相关优秀的文章。 SMP到NUMA CPU就像一个高速公路,不停的从Memory中加载数据,计算数据,再写回Memroy。数据读取和写回的速度,是制约系统性能的一个关键因素。......

线上HTTPS性能问题排查

故障现象 CPU空闲率突然从85%降到30%左右,出现资源不足的告警。当前线上Nginx集群CPU出现瓶颈,可能对请求处理带来较大的延时,好在10min左右故障自动恢复,本文将记录故障时的排查过程,以供读者参考。 故障排查 CPU使用率告警后,第一时间上服务器上确认情况,CPU使用率确实突然使用了70%以上且都是cpu.user用户空间的使用。 通过perf top命令查看发现bn_sqr......