
软件学院毕业设计报告
中文题目:基于银行核心系统的大数据分析
英文题目:Analysis of Big Data Based
On the Bank Core System
学 院: 软件学院
专 业: 软件工程
学生姓名: xxx
学 号: xxx
指导教师: xxx
北京交通大学
2016 年 5 月

北京交通大学毕业设计(论文) 版权使用授权书
2
学士论文版权使用授权书
本学士论文作者完全了解北京交通大学有关保留、使用学士论文的规定。特授权北
京交通大学可以将学士论文的全部或部分内容编入有关数据库进行检索,提供阅览服
务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。
(保密的学位论文在解密后适用本授权说明)
学位论文作者签名: 指导教师签名:
签字日期: 年 月 日 签字日期: 年 月 日

北京交通大学毕业设计(论文) 中文摘要
i
中文摘要
摘要:随着近些年金融行业的发展,现代银行积累了大量的金融数据。特别是近年来信
息技术的发展,使得银行业迎来了大力发展互联网金融的新契机。目前,多数银行已经
建成了新一代的核心业务系统。商业大银行凭借自己雄厚的实力已经利用大数据分析技
术服务银行的发展。而许多中小型银行因为自身实力的不足,大数据分析技术还没有应
用到银行的精准营销、风险管理等方面,大数据技术的引入迫在眉睫。我们的目标是全
面梳理农商行银行数据资源,建立大数据体系架构,力争三年内将大数据分析决策贯穿
到经营管理全流程,提升银行竞争能力。
目前 BI 数据分析平台已经可以使用,主要实现公共报表、管理驾驶舱、补录管理、
系统集成等方面的功能。用户可以查看银行业务报表并进行补录管理等功能的使用,但
是由于银行积累的数据和业务量巨大,目前平台还处于初步阶段,后续工作还有很多。
项目的基本功能通过 Finereport 报表引擎实现,数据库采用核心系统 DB2 数据库、
中间库 MYSQL 以及为了处理半结构化和非结构化数据的分布式数据库 HBASE。大数据处
理数据方面,搭建的是 Hadoop 集群,底层存储机制采取的是 HDFS 分布式文件系统,数
据的处理采用的是 MapReduce 并行计算框架。
关键词:大数据;银行系统;报表平台; 数据处理;

北京交通大学毕业设计(论文) 英文摘要
ii
ABSTRACT
ABSTRACT:
With the development of financial industry in recent years, modern banks have
accumulated a lot of financial data. Especially in recent years the development of information
technology, the banking sector has resulted in a new opportunity to develop the Internet
financial. At present, most banks have built a new generation of core business system. The big
commercial banks with a solid strength has used large data analysis technology to maintain
the development of banks. And many small and medium-sized Banks because of its
insufficient strength, large data analysis technology has not been applied to the bank of
precision marketing, risk management. The introduction of the technology of data is imminent.
Our goal is the comprehensive carding bank data resources, to establish big data architecture,
striving for managing of the whole process of data analysis and decision, enhance core
competitiveness in three years.
BI data analysis platform is ready to use at present, the main implementation of the
platform are public statements, management cockpit, the function of the collection
management, system integration and so on. User can view the bank statements and the use of
collection management, and other functions. However, because of the great Banks
accumulated data and business platform still in the preliminary stage at present, there are a lot
of follow-up work.
Project implementation through FineReport report engine, the basic function of the
database using the core system database DB2, middle database MYSQL and to handle half
structured and unstructured data we choose HBASE distributed database. In big data
processing data, we build the Hadoop cluster and use underlying storage mechanism Hadoop
distributed file system. In data processing we take MapReduce parallel computing framework.
KEYWORDS:the big data; bank system; report forms platform; data processing

北京交通大学毕业设计(论文) 目录
iii
目录
中文摘要 ................................................................ I
ABSTRACT ............................................................... II
第一章 引言 ............................................................. 6
1.1 项目背景 ............................................................ 6
1.2 部分农商行经营现状 .................................................. 6
1.2.1 业务现状 ........................................................ 6
1.2.2 数据处理现状 .................................................... 7
1.3 项目建设目标 ........................................................ 7
1.3.1 建立大数据体系架构 .............................................. 7
1.3.2 建立大数据分析平台 .............................................. 7
1.4 项目意义 ............................................................ 7
1.5 选题来源 ............................................................ 8
1.6 选题的目标和难点 .................................................... 8
1.6.1 选题目标 ........................................................ 8
1.6.2 选题难点 ........................................................ 8
1.7 可行性分析 .......................................................... 9
1.7.1.硬件环境: ...................................................... 9
1.7.2.软件环境: ...................................................... 9
1.7.3.人员配置 ....................................................... 10
1.8 作者主要工作 ....................................................... 10
1.9 论文结构 ........................................................... 10
第二章 本课题涉及的关键技术 ............................................ 12
2.1 HADOOP 集群的安装部署 ................................................ 12
2.1.1 准备工作: ..................................................... 12
2.1.2 安装过程: ..................................................... 12
2.2 HADOOP 集群的工作原理 ................................................ 13
2.3 HBASE 数据库的存储优势 ............................................. 13
2.3.1 HBASE 在半结构化数据和非结构化数据上存储的优势 ................. 13
2.3.2 HBASE 与 Hadoop 的集成 .......................................... 14
2.3.3 HBASE 的水平自动切分 ........................................... 14
2.5 MAPREDUCE 并行计算框架 ............................................... 14
2.5.1 MapReduce 架构图 ............................................... 14
2.5.2 MapReduce 工作原理 ............................................. 15
2.6 FINEREPORT 工作原理 .................................................. 15
2.6.1 创建数据源 ..................................................... 15
2.6.2 创建数据集 ..................................................... 15
2.6.3 创建电子表格 ................................................... 15
2.6.4 发布电子表格 ................................................... 15
2.6.5 设置参数 ....................................................... 16