Posts

Go Channel源码解读

“Don’t communicate by sharing memory, share memory by communicating.” 不要通过共享内存来通信，而要通过通信来共享内存。 channel 介绍 channel是Go语言内置的一个非常重要的feature，相比其他语言，channel为Go提供了goroutine之间通信的独特方式。它和Linux的管道很像，goroutine可以向可写的channel写入数据，也可以从channel中读取数据，还可以关闭channel。这篇文章结合Go的源码来分析channel的实现原理，包括channel的创建、读、写和关闭。 channel实现原理 hchan结构体 Go语言的channel本质上是一个带锁的等待队列的循环缓冲区队列，它的源码在runtime/chan.go中，其实就是一个hchan结构体： type hchan struct { qcount uint // total data in the queue dataqsiz uint // size of the circular queue buf unsafe.Pointer // points to an array of dataqsiz elements elemsize uint16 closed uint32 timer *timer // timer feeding this chan elemtype *_type // element type sendx uint // send index recvx uint // receive index recvq waitq // list of recv waiters sendq waitq // list of send waiters // lock protects all fields in hchan, as well as several // fields in sudogs blocked on this channel. // // Do not change another G's status while holding this lock // (in particular, do not ready a G), as this can deadlock // with stack shrinking. lock mutex } hchan结构体各成员的含义如下： ...

Go语言常见错误分析

Hello，欢迎来到我的Go语言学习笔记，这一篇我们一起来看看Go语言中一些常见错误，以及一些容易被人误解的地方。（另外，也欢大家迎浏览我的上一篇笔记：详解Go Testing😀）为了突出问题，下面举的某些例子可能比较极端，还望大家不要纠结例子的使用场景，明白其中的错误原因即可。另外，欢迎大家补充示例🫵。 Bugs🐞 变量遮蔽（shadowing）🥷🏿 在 Go 中，变量遮蔽（variable shadowing）指的是在内部作用域中声明一个与外部作用域中同名的变量，从而覆盖了外部作用域中的变量。这种bug比较低级，但是可能会出现在比较负载的函数里，而且比较隐蔽，不容易被发现。下面是一个简单的例子，findTarget从给定strs中查找第一个target，返回索引。但是这个简单的函数存在变量遮蔽的bug（到Go Playground运行），返回值永远是-1。 func findTarget(strs []string, target string) (i int) { i = -1 for i := 0; i < len(strs); i++ { if strs[i] == target { break } } return i } 危险的map😈 未初始化 Go语言中未初始化的变量的值为此变量类型的默认值，map的默认值为nil，读值为nil的map是安全的，但是对nil的map进行写操作会引发Panic。(到Go Playround运行) func main() { var m map[string]int // read from nil map, should not panic println(m["a"]) // write to nil map, panic!!! m["a"] = 1 println(m["a"]) } 并行读写map Go语言的禁止多个goroutine同时读和写map（会引发Panic），因此如果有并行操作map的需求，必须使用锁。下面是一个在不加锁的情况下并行读写map的示例，程序会Panic（到Go Playground运行）。 ...

详解Go Testing

TL; DR 本文介绍了Go原生支持的testing的两种测试方法（包内测试和包外测试）和Go支持的四种测试类型（TestXxxx、FuzzXxxx、BenchmarkXxxx和ExampleXxxx）以及使用IDE提示的run test/debug test和手动执行go test命令的区别。和实际项目开发中的被测对象相比，本文的示例比较简单，只是用于说明如何编写四种Go原生支持的测试函数。 Testing 测试的意义测试是软件生命周期中一个重要部分，测试能带来很多好处：减少代码缺陷，提升软件质量；起到文档说明的作用，降低使用门槛；加深开发人员对代码的理解，提高开发人员的自信；提高软件开发效率； …… Go Testing Go对test有很好的支持，go专门提供了用于测试的test子命令，测试代码需要写在以go项目中以_test.go结尾的文件中。Go提供了包内测试和包外测试，测试类型又可分为四种：TestXxxx、BenchmarkXxxx、FuzzXxx、ExampleXxx。包内测试 vs 包外测试包内测试包内测试面向实现。包内测试可以访问包内的所有符号（包括未导出的符号）；测试代码的测试数据构造和测试逻辑通常与被测包的数据结构以及具体实现逻辑紧密结合。因此，如果修改了被测包的数据结构/实现逻辑，一般需要同步调整包内测试代码。包外测试包外测试面向接口。包外测试只能访问被测包导出的API；被测包的API是与外部交互的契约，契约一旦确定就应该长期保持稳定和向前兼容。因此一般修改被测包内部的数据结构和具体实现逻辑不影响包外测试代码。四种测试类型目前Go支持4种测试类型：四种测试方法的命名分别为：TestXxxx、BenchmarkXxxx、FuzzXxx和ExampleXxx。 TestXxxx **用途：**用来检查被测代码的输出是否符合预期，最常用的一种测试类型。 **示例：**实现一个查找最长无重复子串的函数；(直接运行） // mytest/mytest.go // leetcode problem_3: https://leetcode.cn/problems/longest-substring-without-repeating-characters/description/ func LengthOfLongestSubstring(s string) int { if len(s) == 0 { return 0 } // 哈希集合，记录每个字符是否出现过 m := map[byte]int{} n := len(s) // 右指针，初始值为 -1，相当于我们在字符串的左边界的左侧，还没有开始移动 rk, ans := -1, 0 for i := 0; i < n; i++ { if i != 0 { // 左指针向右移动一格，移除一个字符 delete(m, s[i-1]) } for rk+1 < n && m[s[rk+1]] == 0 { // 不断地移动右指针 m[s[rk+1]]++ rk++ } // 第 i 到 rk 个字符是一个极长的无重复字符子串 ans = max(ans, rk-i+1) } return ans } func max(x, y int) int { if x < y { return y } return x } 如何验证这个函数是否符合预期？可以写一个简单的main函数，构造一些测试用例，然后调用这个函数。但是Go有自己的测试方法，只需要在被测代码的目录下创建一个以_test.go结尾的文件，并编写一个测试函数即可： ...

Writing An Interpreter In Rust (1)

Writing An Interpreter In Rust (1) 最近在读 Writing An Interpreter In Go。书本身挺有意思的，它带着你一步一步写一个叫 Monkey 的小语言。我边看边想：既然我现在正在学 Rust，那干脆用 Rust 来实现一遍吧，当作练习。于是就有了这个项目： 👉 GitHub: rand0m42195/monkey-rs 为什么做这个事刚好最近在学rust，像用rust找点事情干；解释器一直是我感兴趣的话题，但之前只是零散看过点原理；用一个小项目把 Rust 和解释器放在一起，会有意思。关于 Monkey 语言 Monkey 是书里的示例语言。它很小，但该有的都有： let 绑定表达式运算条件分支函数（而且是一等公民，可以闭包）后面还有数组、哈希，甚至宏举个简单例子： let add = fn(a, b) { a + b; }; add(2, 3); // => 5 我打算做什么我的目标就是：用 Rust 写出一个能跑的 Monkey 解释器，最后能在 REPL 里玩一玩： >> let a = 10; >> let b = 20; >> a + b; 30 解释器的基本流程大概是这样： ...

XDP 挂载模式剖析

XDP挂载模式对比了解XDP的读者应该知道：XDP是基于eBPF的一个高性能网络路径技术，它的原理就是在数据包处理的早期阶段（在内核网络协议栈之前）挂载eBPF程序对数据包进行处理，从而实现高效的网络数据包处理。如果你写过XDP程序，那么一定知道挂载XDP的时候有多种模式可选，不同模式之间的效率不同。这篇文章我们就来深入剖析一下XDP的集中模式之间到底有哪些区别。首先看看XDP挂载模式有哪几种？不同的挂载模式有和区别？ XDP挂载模式可以以三种方式挂在到网卡上： Generic Native Offloaded 兼容性兼容所有网络设备需要网卡驱动显示支持XDP 特定的可编程网卡执行阶段在网络核心代码中执行（此时已经分配了SKB）在网卡驱动中执行（还未分配SKB）网卡执行，CPU零开销性能较低高最高 XDP 挂载原理 XDP程序是挂载在网络数据包的处理路径上的，所以我们有必要先对网络数据包的处理路径有一个整体的掌握（这里插播一条小广告，我之前写过一篇分析数据包从网卡到内核协议栈的博客）。数据包从网卡到内核网络协议栈的流程可以分为以下几个步骤：数据包到达网卡网卡硬件接收以太帧，做基本校验（如 CRC）。 DMA 写入内存网卡通过 DMA 将数据包写入驱动预先分配好的接收缓冲区（Descriptor Ring）。中断通知 CPU 网卡通过 IRQ 告诉 CPU：“我收到了新数据包”。驱动中断处理函数（ISR）驱动快速处理中断，通常只是调用 __napi_schedule()，把 NAPI poll 加入调度队列。软中断调度 NAPI poll CPU 执行 do_softirq() → net_rx_action() → 调用网卡的的 poll 函数。 poll 函数提取数据包并构造 skb 驱动在 poll 中读取 DMA ring 的描述符，把数据包封装进 sk_buff 结构，交给网络核心层。网络核心层处理网络核心层根据数据包格式选择对应的协议栈，然后交给协议栈处理。 XDP就是挂载在上面的某个阶段，从而实现高效网络数据包处理的。具体来说Native模式的XDP是在网卡的驱动程序中执行的（对应步骤6），而Generic模式的XDP是在网络核心层中执行的（对应步骤7）。这也说明了Native模式的性能比Generic模式高。 ...

Linux 网络编程——socket 系统调用实现剖析

Linux 下多语言网络编程对比还记得Linux网络编程姿势吗？如果不记得了，这里有一个用C语言写的tcp_echo服务，用这段代码能帮我们回忆Linux的网络编程套路：调用socket创建一个网络套接字socket；调用bind给socket绑定地址； listen设置调用accept接收网络请求； #include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> int main(void) { int sd = socket(AF_INET, SOCK_STREAM, 0); struct sockaddr_in addr = { .sin_family = AF_INET, .sin_port = htons(12345), .sin_addr.s_addr = INADDR_ANY, }; bind(sd, (struct sockaddr*)&addr, sizeof(addr)); listen(sd, 5); while (1) { int client = accept(sd, NULL, NULL); char buf[1024]; ssize_t n; while ((n = recv(client, buf, sizeof(buf), 0)) > 0) { send(client, buf, n, 0); // 把读到的内容发送回去 } close(client); } close(sd); return 0; } 如果你用的是Go、Python、Rust等高级编程语言，可能会对这段代码嗤之以鼻，这么简单一个功能，要创建一个可以通信的TCP连接完全不必这么复杂。这是用Go写的，如果不考虑错误处理，只需要调用Listen和Accept。 package main import ( "io" "net" ) func main() { ln, err := net.Listen("tcp", "127.0.0.1:12345") if err != nil { panic("listen err") } for { conn, err := ln.Accept() if err != nil { panic("accept error") } go func(conn net.Conn) { defer conn.Close() io.Copy(conn, conn) }(conn) } } 使用Rust标准库std::net的同步版本如下。 ...

网络数据包接受过程分析——从网卡到内核协议栈（以Intel e1000 + Linux 4.4为例）

引言网络数据包从网卡到应用程序，需要经历一段复杂的旅程。作为开发者，我们平时调用 socket()、recv() 就能轻松拿到数据，却很少思考内核背后究竟发生了什么。本系列文章尝试结合理论流程 + 内核源码分析，逐步剖析 Linux 内核中网络数据包的接收过程。这里选择 Linux 4.4 内核作为例子（代码相对稳定，资料丰富，逻辑上没有过多新特性干扰），并结合 Intel e1000 驱动来具体展示数据包是如何从网卡到达内核网络协议栈的。网络数据包接收的总体流程先给出一个全局视角：数据包从网卡到达内存，再到协议栈的路径，大致如下：数据包到达网卡网卡硬件接收以太帧，做基本校验（如 CRC）。 DMA 写入内存网卡通过 DMA 将数据包写入驱动预先分配好的接收缓冲区（Descriptor Ring）。中断通知 CPU 网卡通过 IRQ 告诉 CPU：“我收到了新数据包”。驱动中断处理函数（ISR）驱动快速处理中断，通常只是调用 __napi_schedule()，把 NAPI poll 加入调度队列。软中断调度 NAPI poll CPU 执行 do_softirq() → net_rx_action() → 调用 e1000 的 poll 函数。 poll 函数提取数据包并构造 skb 驱动在 poll 中读取 DMA ring 的描述符，把数据包封装进 sk_buff 结构，交给内核网络子系统。网络核心层处理 skb 被送到网络核心层，核心层通过数据包的协议类型选择对应的网络协议栈，如IP协议栈，至此网络数据包从网卡到达了Linux内核的网络协议栈。在开始具体分析之前，先说以下相关源码的位置。和网卡相关的代码在驱动目录下（/drivers/net/ethernet），由于我们分析的是Intel的e1000网卡，所以具体位置就是/drivers/net/ethernet/intel/e1000，内核网络协议栈位于网络子系统目录下/net，主要是/net/core/目录，我们主要分析IPv4，所以还会涉及/net/ipv4/中的少量代码。接下来就以Intel e1000网卡为例，来一起探究网卡收包过程吧😀 ...

First Blog

测试这是第一篇博客！