Tag Archives: Linux

昨天另装了个VPS，迁移系统，遇到了很多问题

Posted on 2026年 06月16日 by admin

感叹，确实啊不能总是本地升级，还是要经常进行全新安装和数据转移的，否则总是停留在兼容模式，见识不到行业的发展。昨天遇到几个问题，先说自己的责任事故：用rsync传输home目录，把普通用户的home目录搞成owned uid=0了，这用户登录之后进不去自己的目录，就去了根目录。然后我sudo chown了当前目录，把系统bin目录里的文件都chown了，此时应该已经丢失了很多setuid。赶紧用另一个已经sudo的窗口去chown回来，并给su和sudo增加setuid。然后再执行dpkg –verify，却发现没检查出多少结果来，不知道是不是dpkg根本没记录原始的mode信息？我记得以前rpm –verify应该是可以的。折腾了一会总感觉哪里不对劲，比如用vi编辑文件无法存盘，用nano却可以存盘等现象。最后决定重装。再说几件兼容性问题：我妄图把wordpress的数据库换成Postgres，于是给wordpress安装了pg4wp插件。检查这插件发现它是运行时劫持驱动的，类似于pyMySQL monkey patch的做法，并进行了SQL方言翻译。我用pgloader转移数据的时候发现几个问题：一、字段名字的大小写问题，有些id有些ID二、Ubuntu里pgloader版本太文物了，包版本虽然叫3.6.10但实际上是3.6.4，不支持某些字段类型。搜到2020年的issue说让升级……三、MySQL从8版本开始改用类似于Postgres和Microsoft SQL server的验证方式，从unix domain socket连接的时候直接验证“对方”的用户名；但是pgloader既不支持unix domain socket也不支持mysql新版本的caching sha2 password。于是我又现场学习了30年前学习过一遍的关于mysql身份验证的知识，并成功的把MySQL 8降级到pgloader能够支持的mysql native password…… 然后手工修改大小写，勉强整理到能够显示博客内容，但是登录后直接跳转回登录页，也没错误信息也没错误日志……于是切换回MySQL做了一下WordPress数据库升级，再pgloader到Postgres，这下彻底显示不了了。放弃……

Posted in 默认分类 | Tagged Linux, MySQL, PostgreSQL, WordPress | Leave a comment

GNU和BSD版本的xargs 分隔符不同

Posted on 2023年 01月13日 by JulyClyde

例子：list=”a b c d e”; echo $list |xargs -n1 -I{} echo begin {} end 在Mac上执行结果：begin a endbegin b endbegin c endbegin d endbegin e end 在Linux上执行结果：begin a b c d e end 我这里的需求是有一堆输入，要分别以其为参数，执行一些命令，无论是否成功都要对所有目标执行，所以1 “一些命令”我选用shell function来实现，在其中读了$1作为本次处理的目标2 “所有目标”我选用xargs；如果选Parallel还得额外安装结果发现xargs在切分“以空格为分隔符”的字符串的时候，GNU版本默认不切分，结果把整个“含空格分隔符的字符串”传给函数，执行了一次，而函数里又选了$1作为本次执行目标，其综合结果就是只对列表中第一个目标执行了一遍更惨的是我对比的时候是在Mac上做的对比，怎么看怎么顺眼…… 最后请教同事，用xargs的-d参数解决的 GNU … Continue reading →

Posted in 默认分类 | Tagged Linux | Leave a comment

昨天遇到collectd exec插件的bug，顺便发现他们不按套路出牌啊

Posted on 2022年 12月15日 by JulyClyde

先说症状： collectd exec插件调用的几个外部脚本，其中总会随机有一个缺少COLLECTD_HOSTNAME和COLLECTD_INTERVAL环境变量。搜了一下是这个bug https://github.com/collectd/collectd/issues/3041 然后我好奇啊，就读了一下修改前后的代码，发现collectd不按套路出牌。带有bug的版本：先setenv()设置主进程自己的环境变量，然后尝试fork()，如果成功，在子进程里execvp()；主进程重新unsetenv()恢复主进程自己的环境变量。在多个exec密集执行的时候，都会访问主进程的环境变量，会有race condition，偶尔会发生前一个exec插件刚unsetenv()然后后一个exec插件开始fork()的情况，丢失环境变量。修复后的版本：先fork()，在子进程里准备环境变量数组，尝试execvpe()带签署环境变量数组作为参数，执行新进程（execvpe()为GNU专有扩展），或者先设置extern char **environ指针指向准备好的数组，然后execvp()执行新进程直接继承。别人家套路：先准备环境变量数组，然后fork()，在子进程里execve()并使用前述环境变量数组作为参数。

Posted in 默认分类 | Tagged collectd, Linux | Leave a comment

supervisor泄漏进程案例分析

Posted on 2021年 06月30日 by admin

起因前几天使用 salt ‘*’ test.ping 的时候发现响应内容中有一些“某某minion was already deleted from tracker, probably a duplicate key“的提示信息。刚开始误以为是salt-key管理有问题，尝试删除再重新accept，但是依然会出错。到该minion上检查，发现上面运行了两套salt-minion*三层进程树，一共6个进程，其中一套的PPID为1，另一套的Parent是supervisord。然后就开始研究这种情况是怎么产生的，发现有两种可能：第一种可能 supervisor本身不被systemd监管，被SIGKILL信号杀死时，因为SIGKILL由内核直接处理，所以并没有机会关闭下属的进程，导致下属salt-minion进程树泄漏。而且不但salt-minion进程树泄漏，连同样被supervisor监管的另一个服务也一并泄漏，二者的PPID都变成了1号。不过，如果supervisor本身被systemd监管，在其主进程被杀死时，systemd会给整个service slice cgroup里所有进程补刀，所以并不会泄漏进程；如果supervisor是被SIGTERM信号杀死，它也会给下属子进程发信号，一般也不会泄漏进程。第二种可能 supervisor没有受到影响，正常运行；supervisor监管的salt-minion三层进程树的其中最高层进程（也就是supervisord的直属子进程）被SIGKILL信号杀死，随即，第二层进程exit(1) （不明原因，可能需要看一下salt-minion源码），导致第三层进程变成孤儿。经检查源代码的_spawn_as_child()函数，supervisor针对其监管下的每一个服务，都是采用 fork() + setpgid() +execve() 的方式来启动的，在调用setpgid()改变了process group id之后，第三层进程的孤儿收养关系就不再归属于supervisord进程，而是归属于1号进程。随后supervisor会重启salt-minion服务，产生新的3个进程，加上之前剩下的，一共4个。结论考虑到观察到6个进程而不是4个，实际发生的大概是前一种情况 supervisor虽然有“能力”处理进程退出之后马上重启的工作，但是因为使用了setpgid()把下属服务与自己隔离，没使用cgroup机制把下属服务单独圈起来，又不具备1号的神圣地位，其实它并不知道到底下属了多少、哪些进程，从机制原理上就根本无法保证所有下属的孤儿进程都被其reap。还是建议不要在严肃场合使用 1号进程神圣，所有的服务进程监管工作都应该交给1号进程来处理

Posted in 默认分类 | Tagged Linux, Saltstack, 规范化 | Leave a comment

滥用crond触发systemd-login故障一例

Posted on 2021年 06月30日 by JulyClyde

故障现象 2021年1月20日接到通知，要把systemd升级到219-73.tl2.10或以上、并把rsyslog一起升级，以修复/var/log/messages无日志内容的bug。经实验，发现使用yum升级两个软件包之后，systemd-logind的可执行文件也被更新，导致该服务处于原可执行文件已删除的状态，所以我提议，在升级步骤中增加重启systemd-logind服务的动作。在Ansible playbook里，因为不能表达“大于219-73.tl2.10“这种范围型版本号，所以就明确指定systemd的版本为当前yum能自动安装到的最新版本219-78.tl2.3 2月1日由同事执行更新操作之后，大部分节点都正常工作，但有两台发生重启事故，另有一台上的 35777 systemd-login进程占内存高达4～6G。这三台恰好是一组elasticsearch的三台master节点，均为C8机型，即16G内存的kubernetes容器。检查修复我尝试重启剩余的这台的system-logind，发现新进程3851号仍然占6G内存。查看/proc/3851/smaps，该区域为heap；用pmap命令查看，显示为[ anon ]。对比正常服务器的同一个内存区域，才244K而已。检查三台故障机及其宿主机的日志，发现大量oom记录，其中重启的两台所属宿主机的kubelet也发生故障重启：Feb 1 18:43:50 TENCENT64 kubelet: panic: runtime error: invalid memory address or nil pointer dereference 先gcore一份保留故障现场。由于操作系统组同事不登录上来观察，仅提供重启进程等建议，我只好自己做检查。根据建议，检查了dbus服务（dbus-daemon进程），发现也是可执行文件被删除的状态。检查yum日志，发现在去年6月升级了dbus包，但是服务进程是3月5日启动的，也就是升级包的时候并没有重启这个服务。再次尝试重启systemd-logind，新进程14278号，发现用内存VmPeak: 5270484 kB；但是过了一会儿再观察，发现增加到了VmPeak: 6599828 kB。这说明内存的增长是一个过程，虽然增长比较快，但并不是一下子就6G的。于是我决定strace一下它。先关闭systemd-logind服务。使用命令strace -ff -s 1000 -p 1挂在systemd主进程上做跟踪，并用-o参数把多个进程的跟踪记录分别写在文件里。然后启动systemd-logind服务。这样，strace可以跟踪到 1号进程clone+execv执行systemd-logind的瞬间，以及systemd-login最开头的行为。检查systemd-login的strace记录，发现大量访问 /run/systemd/session/ 目录下面文件的动作。检查该目录，发现大量残留文件。搜索，发现 https://www.jianshu.com/p/343a072e2521 … Continue reading →

Posted in 默认分类 | Tagged Linux, systemd, 规范化 | Leave a comment

经典错误——使用/etc/security/limits.conf配置文件和 ulimit -n命令

Posted on 2019年 08月5日 by admin

很多以讹传讹的半桶水文章，都教人修改/etc/security/limits.conf配置文件来放宽“打开的文件数量”限制，如果可以再多一滴水的话，还会加一句“重启后生效”。其实，使用这个配置文件，和使用ulimit -n命令一样，属于很经典的错误。设置或放宽“打开的文件数量“限制，其本质是调用了setrlimit()函数，设置了RLIMIT_NOFILE资源。在有特权的程序中调用这个函数，可以提高上限（放宽限制），而普通权限的程序只能自己勒死自己和新生的子进程。而/etc/security/limits.conf这个配置文件是怎么生效的呢？其实用dpkg -S或rpm -qf查一下就很容易知道，这个文件是pam_limits.so的配置文件，而pam_limits.so是在/etc/pam.d/中被login和sshd等多个配置文件声明将要被调用的。系统开机的时候，1号进程init“自然而然”是root身份运行，其下属的getty/login和sshd进程，也都是root身份。这些程序都可以随意调用setrlimit。当身份认证（部分工作由PAM来做，所以可以读shadow文件）完成之后，login和sshd的子进程会为用户准备好session（网络登录调用pam_mkhomdir建设HOME目录、pam_limits模块设置rlimit、pam_env模块读取/etc/environment设置环境变量，甚至显示motd这种功能也是PAM模块实现的）并将自己降级到登录的用户身份，再启动一个shell给用户使用。 /etc/security/limits.conf 只对“调用过pam_limits.so“的登录过程有效。但并不是所有场景都经过这个过程的。而ulimit命令呢，它本身只是shell是一个内部命令而已，只对“该shell进程”及随后新产生的子进程有效。但是需要放宽rlimit的程序，往往不是在shell中由用户手工运行的程序，而是提供大规模网络服务的后台进程。它们所需的rlimit，要在init脚本、service unit文件中设置；支持从root身份启动的服务，一般都有自行设置rlimit的能力。如果不理解上面的内容，就容易引发一些莫名其妙的故障。比如之前我在FreeWheel工作的时候，前辈为后台服务写的的init脚本里没有调用ulimit -n命令，而在root用户的~/.bash_profile里有这个命令。造成的后果，就是开机自动启动该服务的时候，启动的是一个打开文件数量受限，以至于无法保持很多socket的网络服务，而当运维人员登录进去手工重启服务之后，又莫名其妙变好了，以至于没法检查这个故障到底是怎么发生的。

Posted in 默认分类 | Tagged Linux, 规范化 | Leave a comment

在嵌入式开发板上使用蓝牙耳机

Posted on 2018年 01月23日 by admin

简单记录一下：安装 bluez pulseaudio-module-bluetooth 软件包 pulseaudio是用户级后台服务，视情况可能需要手工-D启动之 bluetoothctl命令进入交互式界面，先scan on 等看到蓝牙耳机之后，pair和connect到蓝牙耳机的MAC地址，看到连接成功之后scan off并退出bluetoothctl pactl list sinks查看设备，看看它支持哪些profile，有可能需要通过pactl set-card-profile将其切换到a2dp aplay -Dpulse 指定pulse虚拟设备播放文件还没搞定录音。看起来话务耳机在handfree等模式似乎需要特殊步骤激活录音模式？

Posted in 默认分类 | Tagged Bluetooth, Linux | Comments Off

hostname和dnsdomainname命令

Posted on 2017年 12月14日 by JulyClyde

先讲结论：忽略已经过时的NIS/YP相关内容（/sbin/sysctl kernel.domainname、/bin/domainname、/bin/nisdomainname、/bin/ypdomainname等） /bin/hostname、/sbin/sysctl kernel.hostname 和 /bin/uname -n 是一码事，都是本机的主机名 /bin/dnsdomainname 命令会把上述主机名按“第一个点”分成两端，输出后一段。这是简单的字符串处理的结果，在内核和DNS层面均无正式意义。 /etc/resolv.conf文件里的search或domain指令，用于从本机访问外部短主机名时，补充域名的后缀部分。 hostname命令：通过gethostname(2)函数读到本机的主机名。在glibc的情况下，gethostname(2)不是syscall而是标准库函数，转而调用uname(2) （我不太确认调用的是glibc uname还是syscall uname）。根据 https://github.com/torvalds/linux/blob/master/Documentation/sysctl/kernel.txt#L285 的说法，/proc/sys/kernel/hostname、sysctl hostname 和hostname命令应该是功能相同的。 hostname -d 或者 dnsdomainname 命令：根据/etc/host.conf指定的顺序，先尝试/etc/hosts然后尝试DNS，查找自己的主机名。如果能找到，把第一段去掉之后，输出剩下的部分。这个输出不具备内核意义，只是主机名经过字符串处理之后的派生结果 hostname –fqdn命令： getaddrinfo()函数查询到的ai_canonname strace观察到的行为是去DNS查一下主机名（如果主机名是短形式，按需补充/etc/resolv.conf里声明的search/domain后缀）对应的A记录，只要能查到，即使返回的IP地址不是本机的也不管，就以这个主机名作为结果。 hostname –all-fqdn命令：拿自己的IP地址们循环调用getnameinfo()函数（strace/tcpdump观察到的具体行为是去DNS查PTR记录），并全部输出

Posted in 默认分类 | Tagged DNS, Linux | Leave a comment

墨菲定律之多处保存必然会出现不一致——谈Linux上的时区问题

Posted on 2013年 07月26日 by JulyClyde

技术部的工作日报，原本是早晨9点发，脚本换了一台服务器运行之后变成17点了。算算时差也知道是时区问题。检查了一下， /etc/timezone 内容误为 Etc/UTC，而 /etc/localtime 是从 /usr/share/zoneinfo/Asia/Shanghai 复制过来的，二者不一致。date命令使用 /etc/localtime 而 cron 按 /etc/timezone 文件执行，于是造成了执行时间不对的问题另外需要注意的是，cron 只在开始运行时读取一次该文件，而每分钟唤醒时不再读取，所以改过文件之后还得重启该服务；又得注意的是，service cron stop 似乎并不会终止cron进程，所以……你懂的以上就是墨菲定律之：多处保存，必然会出现不一致

Posted in 默认分类 | Tagged Linux, 规范化 | Leave a comment

不能念叨啊，一念叨就出事——兼谈xen的network-bridge脚本问题

Posted on 2011年 01月14日 by JulyClyde

昨晚还说呢，如果今天一天没事，这周就算安全过去了，@sgub 和@chifeng 都告诫我说不能念叨这事，今天果然！下午，同事远程关闭错了机器。重新开机之后，发现 xenbr0 网桥没有了。看了一下，是 /etc/xen/scripts/network-bridge 没成功运行造成的。这个脚本用默认路由所在的网卡做一个网桥，然后把虚拟机接在这个网桥上，以便使虚拟机能直接上网。但我们的服务器却有俩公网IP和俩默认路由，就把那个脚本搞糊涂了。其实这俩默认路由是路由器上的同一个接口的两个 IP 地址，连 MAC 都一样的。我删除掉其中一个默认路由，再运行network-bridge 脚本，就成功了。

Posted in 默认分类 | Tagged bugs, Linux, Virtualization, 规范化 | Leave a comment

Tag Archives: Linux

昨天另装了个VPS，迁移系统，遇到了很多问题

GNU和BSD版本的xargs 分隔符不同

昨天遇到collectd exec插件的bug，顺便发现他们不按套路出牌啊

supervisor泄漏进程案例分析

滥用crond触发systemd-login故障一例

经典错误——使用/etc/security/limits.conf配置文件和 ulimit -n命令

在嵌入式开发板上使用蓝牙耳机

hostname和dnsdomainname命令

墨菲定律之多处保存必然会出现不一致——谈Linux上的时区问题

不能念叨啊，一念叨就出事——兼谈xen的network-bridge脚本问题

Meta

Blogroll

Mine

Tag Archives: Linux

Tags

Meta

Blogroll

Mine