Posted 2025-08-25Updated 2025-08-2728 minutes read (About 4222 words)

初学bufio包

第一阶段：理解核心思想 —— 为什么要用 `bufio`？

在直接看代码之前，你必须先理解 bufio 存在的根本原因：减少系统调用，提升 I/O 性能。

想象一下你要从超市（磁盘）买100件商品（数据）。你有两种方式：

不用 bufio: 每次只拿一件商品，然后去收银台结账，来回100次。结账这个动作就像一次“系统调用（System Call）”，非常耗时。
使用 bufio: 你推一个购物车（缓冲区 Buffer），先把100件商品都放进购物车里，最后只去收银台结账一次。

bufio 包就是这个“购物车”。它在内存中开辟一块缓冲区，当你读取数据时，它会一次性从磁盘（或网络）读取一大块数据到缓冲区；当你写入数据时，它会先把数据写入缓冲区，等缓冲区满了或者你主动要求时，才一次性写入磁盘。

核心结论: bufio 通过在内存中增加一个缓冲区，将多次零散的 I/O 操作合并为单次或少数几次大的 I/O 操作，从而显著提高性能。

第二阶段：认识三大主角

bufio 包主要提供了三个非常有用的类型，你需要分别了解它们：

bufio.Reader: 带缓冲区的读取器。
bufio.Writer: 带缓冲区的写入器。
bufio.Scanner: 一个更高级、更方便的工具，用于读取结构化的文本数据（比如按行、按单词读取）。

第三阶段：动手实践（最重要的一步）

现在，我们通过具体的代码来学习每个主角的用法。

1. `bufio.Reader`：更灵活的读取

Reader 适合需要对读取过程有更多控制的场景，比如读取到特定分隔符为止。

创建方式:

import (
    "bufio"
    "os"
)

file, _ := os.Open("my_file.txt")
defer file.Close()

reader := bufio.NewReader(file) // 将一个 io.Reader 包装成 bufio.Reader

常用方法:

ReadString(delim byte): 读取直到第一次遇到 delim 字节，返回一个包含 delim 的字符串。按行读取文本文件是它的经典用法。
ReadLine(): 一个更底层的按行读取方法，通常不推荐直接使用，ReadString('\n') 或 Scanner 更好。
ReadByte(): 读取并返回一个字节。
Peek(n int): 非常酷的功能！ 它可以“偷看”接下来的 n 个字节，但不移动读取指针。也就是说，下次再读，还是从这 n 个字节开始。

实战代码：使用 ReadString 按行读取文件

package main

import (
    "bufio"
    "fmt"
    "io"
    "os"
    "strings"
)

func main() {
    // 准备一个字符串源，实际中可以是 os.File
    r := strings.NewReader("第一行\n第二行\n第三行")

    reader := bufio.NewReader(r)

    for {
        line, err := reader.ReadString('\n') // 读取直到遇到换行符
        if err == io.EOF { // io.EOF 表示文件已经读完
            if len(line) > 0 {
                fmt.Print(line) // 打印最后一行（可能没有换行符）
            }
            fmt.Println("文件读取完成")
            break
        }
        if err != nil {
            fmt.Println("读取文件时发生错误:", err)
            return
        }
        // ReadString 返回的行会包含分隔符本身，我们通常需要去掉它
        fmt.Print(strings.TrimSpace(line))
        fmt.Println(" (已读取一行)")
    }
}

2. `bufio.Scanner`：现代、简洁的文本读取利器

对于按行、按单词读取文本这种常见需求，Scanner 是首选方案。它更简单、性能更好，并且能正确处理 \n 和 \r\n 换行符。

创建方式:

import "bufio"
import "os"

file, _ := os.Open("my_file.txt")
defer file.Close()

scanner := bufio.NewScanner(file) // 将一个 io.Reader 包装成 bufio.Scanner

常用方法:

Scan() bool: 扫描到下一个“令牌”（默认是行），如果成功则返回 true。它通常用在 for 循环的条件里。
Text() string: 返回最近一次 Scan() 扫描到的令牌（行）的字符串内容。
Bytes() []byte: 功能同 Text()，但返回字节切片。
Err() error: 返回扫描过程中遇到的错误。

实战代码：使用 Scanner 按行读取文件（推荐方式）

package main

import (
    "bufio"
    "fmt"
    "os"
    "strings"
)

func main() {
    r := strings.NewReader("苹果\n香蕉\n橘子")
    
    scanner := bufio.NewScanner(r)

    // for scanner.Scan() 是 Go 中读取文本的惯用写法 (idiom)
    for scanner.Scan() {
        line := scanner.Text() // 获取当前行内容
        fmt.Printf("扫描到一行: %s\n", line)
    }

    // 扫描结束后，检查是否有错误发生
    if err := scanner.Err(); err != nil {
        fmt.Println("扫描时发生错误:", err)
    }
}

进阶: scanner.Split() 方法可以让你自定义分割规则，比如按单词、按逗号等。

3. `bufio.Writer`：高效写入

Writer 的核心在于它的缓冲区。数据先写入内存，直到缓冲区满了或你手动“刷新”，才会真正写入底层的文件或网络连接。

创建方式:

import "bufio"
import "os"

file, _ := os.Create("output.txt")
defer file.Close()

writer := bufio.NewWriter(file)

常用方法:

WriteString(s string): 将字符串写入缓冲区。
Write(p []byte): 将字节切片写入缓冲区。
Flush(): 至关重要的方法！ 将缓冲区中所有的数据立刻写入底层的 io.Writer（例如文件）。忘记调用 Flush 是最常见的错误！

实战代码：使用 Writer 高效写入文件

package main

import (
    "bufio"
    "fmt"
    "os"
)

func main() {
    file, err := os.Create("output.txt")
    if err != nil {
        panic(err)
    }
    defer file.Close()

    writer := bufio.NewWriter(file)

    // 写入几行字符串到缓冲区
    _, _ = writer.WriteString("Hello, bufio!\n")
    _, _ = writer.WriteString("这是第二行。\n")
    
    fmt.Println("数据已写入缓冲区，但尚未写入文件。")
    // 此时打开 output.txt，你会发现文件是空的！

    // 使用 Flush 将缓冲区内容写入文件
    err = writer.Flush()
    if err != nil {
        panic(err)
    }

    fmt.Println("Flush() 已调用，数据已成功写入文件。")
    // 现在打开 output.txt，内容就在里面了。
}

最佳实践: 使用 defer 来确保 Flush 总能被执行。

func writeFile() {
    file, _ := os.Create("output.txt")
    defer file.Close()
    
    writer := bufio.NewWriter(file)
    defer writer.Flush() // <--- 使用 defer 确保在函数退出前刷新缓冲区

    writer.WriteString("这样写更安全！\n")
}

第四阶段：总结与选择

场景	推荐工具	为什么？
按行/按单词读取文本文件	`bufio.Scanner`	代码最简洁、性能好、自动处理换行符，是首选。
需要读取到特定字符为止	`bufio.Reader`	`ReadString` 方法完美匹配此需求。
需要“偷看”后面的数据而不移动指针	`bufio.Reader`	只有 `Reader` 提供 `Peek` 功能。
大量、频繁地写入小数据到文件或网络	`bufio.Writer`	显著提升写入性能，减少系统调用。
读取整个小文件	`os.ReadFile`	如果文件不大，一次性读入内存更简单，没必要用 `bufio`。

学习建议:

亲手把上面的每一段代码都敲一遍，并尝试修改它（比如换成真实的文件操作）。
理解 Flush 的重要性，并尝试不调用它看看会发生什么。
练习用 Scanner 读取标准输入 os.Stdin。

问题1

总结来说，我只需要创建bufio.Reader: 带缓冲区的读取器。
bufio.Writer: 带缓冲区的写入器。
bufio.Scanner: 一个更高级、更方便的工具，用于读取结构化的文本数据（比如按行、按单词读取）。这三个东西，然后按照需求调用相应的函数就行了是吧

是的，你的总结非常精准！完全正确。

bufio 包的学习和使用核心，就是围绕这三个“主角”展开的。你可以把它们理解为你工具箱里三种不同但相关的工具：

bufio.Reader (带缓冲区的读取器)
- 核心功能: 提供一个缓冲区来加速底层 io.Reader 的读取操作。
- 何时使用: 当你需要比 Scanner 更底层的控制时，比如：
  - 读取到任意定的分隔符为止 (ReadString)。
  - 需要“偷窥”数据流而不消耗它 (Peek)。
  - 按特定字节数读取 (Read)。
bufio.Writer (带缓冲区的写入器)
- 核心功能: 提供一个缓冲区来加速底层 io.Writer 的写入操作。
- 何时使用: 当你需要向文件或网络连接进行大量、零碎的写入时。它能把这些零碎的写入合并成大的块，一次性发送，性能提升巨大。
- 必须记住: 用完一定要调用 Flush()，否则缓冲区的数据会丢失！最稳妥的方式是 defer writer.Flush()。
bufio.Scanner (高级文本扫描器)
- 核心功能: 专门用于读取结构化的文本数据。
- 何时使用: 这是处理文本文件最常用、最推荐的工具。
  - 按行读取文件或标准输入（最常见的场景）。
  - 按单词、逗号或其他自定义规则分割文本。
- 优点: 接口极其简洁（for scanner.Scan() 循环），性能好，自动处理各种换行符问题，不容易出错。

你的学习和使用流程就是：

明确你的 I/O 需求:
- “我要读取一个大文本文件，一行一行地处理。” -> 选择 bufio.Scanner。
- “我要向一个文件里循环写入上万条日志。” -> 选择 bufio.Writer。
- “我要从一个网络连接中读取数据，直到遇到一个特定的字节 0xFF 为止。” -> 选择 bufio.Reader。
创建实例:
- 找到你的原始 io.Reader（如 os.File, strings.Reader, net.Conn）或 io.Writer。
- 调用 bufio.NewScanner(reader), bufio.NewReader(reader) 或 bufio.NewWriter(writer) 来“包装”它，得到一个带缓冲区的增强版工具。
调用方法:
- 根据你的具体需求，调用对应工具的方法（如 scanner.Scan(), reader.ReadString(), writer.WriteString()）。
收尾工作:
- 如果是 Writer，务必 Flush()。
- 如果是 Scanner，最好检查一下 scanner.Err()。
- 记得关闭底层的 io.Closer（如 file.Close()）。

所以，你完全掌握了 bufio 的精髓。剩下的就是在实际编码中多加练习，熟悉这三个工具的常用方法，你就能在 Go I/O 编程中游刃有余了。

问题2

就是传入的东西，然后赋予的值，读取或者写入的角色我不是很清楚

你提出了一个非常关键的概念性问题，很多初学者都会在这里感到困惑。我们来彻底把它弄明白。

bufio 的所有工具（Reader, Writer, Scanner）都扮演着一个**“中间人”或者说“加工者”的角色。它们本身不是数据的来源或目的地，而是对数据的流动进行“增强”或“包装”**。

让我们用一个生动的比喻来解释：自来水系统。

数据源 (比如文件 os.File)：就像是市政供水管道。水（数据）在里面，但水压可能不稳定，开关一次成本很高（系统调用）。
bufio.Reader：就像是你家厨房水槽上的带蓄水池的净水器。
你的程序：就是你，想要接水喝。

1. `bufio.Reader` (带蓄水池的净水器)

传入的东西: os.File (市政供水管道)
赋予的值: bufio.Reader (带蓄水池的净水器)
角色: 读取的角色

流程解释:

reader := bufio.NewReader(file)
- 你做了什么：你把市政供水管道 (file) 接到了净水器 (bufio.Reader) 的进水口。
- 发生了什么：bufio.Reader 内部立刻从 file 里“猛吸”一大口水（比如4KB的数据）到自己的**蓄水池（缓冲区）**里，然后关上阀门。它只和市政管道交互了这一次，成本很低。
line, _ := reader.ReadString('\n')
- 你做了什么：你按下了净水器上的“出水”按钮，想要接一杯水（一行数据）。
- 发生了什么：净水器直接从它自己的蓄水池里给你放水，直到遇到换行符。这个过程非常快，因为它操作的是内存里的蓄水池，根本没有去碰那个开关成本很高的市政管道。
- 如果蓄水池空了怎么办？：只有当蓄水池里的水不够你接一杯时，净水器才会再次打开阀门，从市政管道里再“猛吸”一大口水进来，然后再从新的蓄水池里给你放水。

总结 Reader 角色:
它是一个带缓冲区的读取代理。你不再直接从原始、低效的数据源读取，而是从这个高效的、带“蓄水池”的代理那里读取。它负责在背后管理与原始数据源的交互，为你屏蔽了复杂性和低效性。

2. `bufio.Writer` (带储压罐的热水器)

传入的东西: os.File (你家的排水管道)
赋予的值: bufio.Writer (带储压罐的热水器)
角色: 写入的角色

流程解释:

writer := bufio.NewWriter(file)
- 你做了什么：你把热水器的出水口 (bufio.Writer) 接到了你家的排水管道 (file)。
- 发生了什么：bufio.Writer 准备好了自己的储压罐（缓冲区）。
writer.WriteString("一些话\n")
- 你做了什么：你倒了一杯水（一些数据）到热水器的储压罐里。
- 发生了什么：这杯水只是进入了储压罐，并没有流进排水管道。因为每次都去打开排水管道的阀门成本太高了。
writer.Flush()
- 你做了什么：你按下了“冲洗/排空”按钮。
- 发生了什么：热水器打开阀门，一次性将储压罐里积攒的所有水，强力地冲入排水管道。这次交互虽然成本高，但我们只做了一次，而不是倒一杯水就冲一次。

总结 Writer 角色:
它是一个带缓冲区的写入代理。你不再直接向原始、低效的目标写入，而是先把所有东西都“扔给”这个代理，它会帮你攒起来，最后在你需要的时候（或者攒满了的时候）一次性地、高效地写入最终目的地。

3. `bufio.Scanner` (智能饮水机)

Scanner 是 Reader 的一个更高级、更自动化的版本，特别适合处理文本。

传入的东西: os.File (市政供水管道)
赋予的值: bufio.Scanner (智能饮水机)
角色: 一个更智能的读取角色

流程解释:

scanner := bufio.NewScanner(file)
- 和 Reader 一样，你把市政管道 (file) 接到了智能饮水机 (bufio.Scanner)。它内部也有一个蓄水池（缓冲区），也会先猛吸一口水。
for scanner.Scan()
- 你做了什么：你不停地按“接一杯”按钮。
- 发生了什么：scanner.Scan() 会自动从蓄水池里帮你接好正好一杯（默认是一行）的水。如果成功接到，它就返回 true。你不需要关心它是怎么找到杯子边界（换行符）的，它都帮你处理好了。
line := scanner.Text()
- 你做了什么：你把刚刚接好的那杯水拿起来喝。

总结 Scanner 角色:
它是一个自动化的、面向文本的读取助手。你只需要不断地告诉它“给我下一个”，它就会自动、高效地从原始数据源中把格式化好的数据（比如一行行的文本）递给你。

最终结论

“传入的东西” (os.File, net.Conn等) 是原始的数据源或目的地。它们是底层、直接的 I/O 接口。

“赋予的值” (bufio.Reader, bufio.Writer等) 是一个带缓冲区的、高效的代理。

“角色”: bufio 的工具就是这个代理的角色。它夹在你和原始数据源之间，通过缓冲区这个核心机制，让你的数据读写变得更高效、更方便。你后续的所有 I/O 操作，都应该通过这个“代理”来进行，而不是再回头去操作原始的那个 file 对象。

初学bufio包

https://cofeesy.github.io/2025/08/25/初学bufio包/

Author

Cofeesy

Posted on

2025-08-25

Updated on

2025-08-27

Licensed under

#Goland

初学bufio包

第一阶段：理解核心思想 —— 为什么要用 `bufio`？

第二阶段：认识三大主角

第三阶段：动手实践（最重要的一步）

1. `bufio.Reader`：更灵活的读取

2. `bufio.Scanner`：现代、简洁的文本读取利器

3. `bufio.Writer`：高效写入

第四阶段：总结与选择

问题1

你的学习和使用流程就是：

问题2

1. `bufio.Reader` (带蓄水池的净水器)

2. `bufio.Writer` (带储压罐的热水器)

3. `bufio.Scanner` (智能饮水机)

最终结论

Author

Posted on

Updated on

Licensed under

Like this article? Support the author with

Comments

Recents

Archives

Tags

初学bufio包

第一阶段：理解核心思想 —— 为什么要用 bufio？

第二阶段：认识三大主角

第三阶段：动手实践（最重要的一步）

1. bufio.Reader：更灵活的读取

2. bufio.Scanner：现代、简洁的文本读取利器

3. bufio.Writer：高效写入

第四阶段：总结与选择

问题1

你的学习和使用流程就是：

问题2

1. bufio.Reader (带蓄水池的净水器)

2. bufio.Writer (带储压罐的热水器)

3. bufio.Scanner (智能饮水机)

最终结论

Author

Posted on

Updated on

Licensed under

Like this article? Support the author with

Comments

Recents

Archives

Tags

第一阶段：理解核心思想 —— 为什么要用 `bufio`？

1. `bufio.Reader`：更灵活的读取

2. `bufio.Scanner`：现代、简洁的文本读取利器

3. `bufio.Writer`：高效写入

1. `bufio.Reader` (带蓄水池的净水器)

2. `bufio.Writer` (带储压罐的热水器)

3. `bufio.Scanner` (智能饮水机)