深入SQLite:数据处理与查询实战
1. 数据准备与SQLite启动
首先,解压 .tgz
文件会生成一个 playground
目录,其中包含数据集、一些示例代码和实用工具。我们要处理的数据集是关于Ubuntu 18.04系统上已安装软件包的列表,涵盖软件包名称、简短描述、包含的文件列表以及文件大小。
数据集中的文件为 .tsv
(制表符分隔值)文件,主要有两个:
- package_descriptions.tsv
:包含两列数据,即软件包名称和软件包描述。
- package_files.txv
:包含三列数据,分别是软件包名称、该软件包安装的文件名称以及文件大小。
启动SQLite很简单,只需执行 sqlite3
命令,还可以选择指定一个文件来存储数据库表。若不指定文件名,SQLite会在内存中创建一个临时数据库。
me@linuxbox:~/advemture-sql$ sqlite3
SQLite version 3.22.0 2018-01-22 18:45:57
Enter ".help" for usage hints.
Connected to a transient in-memory database.
Use ".open FILENAME" to reopen on a persistent database.
sqlite>
加载完