LINQ 和字符串 (C#)

LINQ 可用于查询和转换字符串和字符串集合。 这在处理文本文件中的半结构化数据时尤其有用。 LINQ 查询可以与传统的字符串函数和正则表达式合并。 例如,可以使用 String.SplitRegex.Split 方法来创建可稍后使用 LINQ 查询或修改的字符串数组。 可以使用 LINQ 查询的 where 子句中的 Regex.IsMatch 方法。 并且可以使用 LINQ 查询或修改正则表达式返回的 MatchCollection 结果。

还可以使用本节介绍的技术将半结构化的文本数据转换为 XML。 有关详细信息,请参阅如何从 CSV 文件生成 XML

本节中的示例分为两类:

查询文本块

可以使用 String.Split 方法或 Regex.Split 方法将文本块拆分为可查询的较小字符串数组,从而对其进行查询、分析和修改。 可以先将源文本拆分为词语、句、段落、页或任何其他条件,然后根据查询的需要执行其他拆分。

查询文本格式的半结构化数据

许多不同类型的文本文件都包含一系列行,通常具有类似的格式设置,例如制表符分隔或逗号分隔的文件或固定长度的行。 将此类文本文件读入内存后,可以使用 LINQ 来查询和/或修改其中的行。 LINQ 查询还简化了合并来自多个源的数据的任务。

请参阅