源码阅读技巧总结
配置文件
配置参数决定着系统如何运行。因此,了解系统功能必先找到系统的配置文件。以笔者熟悉的系统为例:
- SparkSQL:
org.apache.spark.sql.internal.SQLConf.scala
- Parquet:
org.apache.parquet.column.ParquetProperties
org.apache.parquet.hadoop.ParquetInputFormat
org.apache.parquet.hadoop.ParquetOutputFormat
- ...
通过如下方法可以看到指定功能是如何实现的
- 根据配置文件中的参数对应代码的
git blame
, 找到 commit - 看配置参数被系统中哪些地方引用了