目录
4.1 经济/金融数据库
4.1.1 金融数据与数据库
4.1.2 国外金融数据库概况
4.1.3 国内金融数据库概况
4.1.4 数据的主要内容
4.2 数据格式
4.3 数据的导入
4.3.1 从控制台上输入数据
4.3.2 上市公司财务报表信息读取
4.4 [数据的预处理]
4.1.1 时序数据的预处理
4.1.2 截面数据的预处理[略]
4.1 经济/金融数据库
4.1.1 金融数据与数据库
 R
 包:
 RBloomberg
 和
 IBrokers
 有偿 
 
 tseries
 和
 quantmod 
 
 美联储 
 www.stlouisfed.org
 ,
 Yahoo
 财经
 finance.yahoo.com 
 
4.1.2 国外金融数据库概况
 美国彭博社(收费
 ) 
 
 加拿大汤森路透 
 www.datastream.com
 
4.1.3 国内金融数据库概况
  万得
  Wind 
  www.wind.com.cn 
  (实验室排队预约) 
 
 
 
  北京瑞思 
  www.resset.cn 
 
 
 
  深圳国泰安 
  www.gtarsc.com 
 
 
 
  巨潮 
  www.cninfo.com.cn 
 
 
 
  聚源 
  www.gildata.com 
 
 
 
  财汇 
  www.finchina.com 
 
 
 4.1.4 数据的主要内容
   国泰安为例:公司财务报表(
   1990
   年来所有
   AB
   古上市公司的季报,半年报,年报)、股票(基本 
  
 
  
   资料和全部交易数据)、债券、基金(投资组合,净值,主要财务指标) 
  
 
   
  4.2 数据格式

4.3 数据的导入

4.3.1 从控制台上输入数据

4.3.2 上市公司财务报表信息读取
    1. 
    运用剪贴板 
    read.delim('clipboard') 
   
 
   
    2. 
    转换格式,再调用 
    read.scv() 
    或者 
    read.txt() 
    ( 
   
 
   
    或者 
    read.table() 
    读取
    txt
    文本文件) 
   
 
   
    3. 
    股票数据在线读取 
   
 
   
    补充:股票价格的信息:
    OHLC 
   
 
   
    一般
    “A
    股股票
   
 
    
   4. 读取外部数据源
 
 
4.4 [数据的预处理]
4.1.1 时序数据的预处理
    1. 
    数据合并:包 
    merge.xts() 
   
 
   
    2. 
    子集选择:
    变量选取
    ,直接用
    “
    变量名
    ”
    ,从数据框中选取;
    样本选取
    ,根据逻辑条件用 
    subset() 
   
 
   
    函数 
   
 
   
    3. 
    随机抽样: 
    sample() 
   
 
   
    4. 
    数据补齐:缺失值可以用 
    na.approx() 
    补齐;时序数据可用 
    align() 
    函数 
   
 
   
    5. 
    频率转换:高频转低频 
    to.monthly() 
    ;低频转高频(有数据失真风险) 
   
 
   
    6. 
    滚动窗操作 
   
 
    
   
提取中国A股个股信息:只知道股票代码,不知道股票简称


非联网环境可以用xlsx读入,但此时的数据类型是dataframe




 
4.1.2 截面数据的预处理[略]

![[附源码]Python计算机毕业设计Django汽车租赁管理系统](https://img-blog.csdnimg.cn/0331c370a7234ab093e85295dae75ce2.png)

















![[附源码]计算机毕业设计小型银行管理系统Springboot程序](https://img-blog.csdnimg.cn/6ce37f640f3f40ffa52ad79353dabdcc.png)
