Skip to content
本站总访问量次, 访客数人次

源码阅读技巧总结

配置文件

配置参数决定着系统如何运行。因此,了解系统功能必先找到系统的配置文件。以笔者熟悉的系统为例:

  • SparkSQL:
    • org.apache.spark.sql.internal.SQLConf.scala
  • Parquet:
    • org.apache.parquet.column.ParquetProperties
    • org.apache.parquet.hadoop.ParquetInputFormat
    • org.apache.parquet.hadoop.ParquetOutputFormat
  • ...

通过如下方法可以看到指定功能是如何实现的

  • 根据配置文件中的参数对应代码的 git blame, 找到 commit
  • 看配置参数被系统中哪些地方引用了

Ref

Comments