【Python金融数据分析基础】NumPy基础：数组操作与计算

立即解锁

发布时间: 2025-04-11 08:20:57 阅读量: 42 订阅数: 93

【数据处理与科学计算】NumPy数组高级操作指南：从基础到实战案例详解

![【Python金融数据分析基础】NumPy基础：数组操作与计算](https://img-blog.csdnimg.cn/img_convert/6551dc917c3346f130fc916b24d7e449.png) # 1. NumPy数组的创建和属性 NumPy库是Python中用于数值计算的核心库，它的基础是强大的数组对象。数组是同类型数据的多维集合，能够提供高效的数值处理能力。创建NumPy数组可以通过多种方式实现，最简单的就是使用`numpy.array()`函数。例如： ```python import numpy as np arr = np.array([1, 2, 3, 4, 5]) ``` 这个例子创建了一个一维数组。`arr`对象拥有多个属性，如`ndim`表示数组的维度，`shape`表示数组的形状（各维度的长度），`size`表示数组元素的总个数，`dtype`表示数组元素的数据类型。正确理解和使用这些属性对于数据分析和科学计算是至关重要的。通过本章的学习，读者将掌握如何创建不同维度的NumPy数组，并熟悉数组的基本属性，为后续深入学习NumPy打下坚实的基础。 # 2. NumPy数组的操作技巧 ### 2.1 基础操作 #### 2.1.1 数组的索引和切片 NumPy数组的索引和切片是数组操作中最基本也是最常用的功能之一。通过索引和切片，我们可以访问数组中的特定元素或元素的子集。 ```python import numpy as np # 创建一个简单的二维数组 array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # 访问特定元素：第一行第二列的元素 element = array[0, 1] print(element) # 输出: 2 # 切片操作示例：提取第一行所有元素 row = array[0, :] print(row) # 输出: [1 2 3] # 切片操作示例：提取第二列所有元素 column = array[:, 1] print(column) # 输出: [2 5 8] ``` 索引通常是一个整数或整数数组，表示要访问的元素的位置。切片则是使用冒号分隔的两个整数来表示范围，例如`array[start:stop]`，其中`start`是开始索引（包含），而`stop`是结束索引（不包含）。在索引时，我们还可以使用负数来从数组的末尾开始计数，例如`array[-1]`会访问最后一行的所有元素。 #### 2.1.2 数组的合并和拆分合并和拆分是处理多个数组时常用的操作。NumPy提供了多个函数来处理这些操作，如`np.concatenate()`, `np.split()`, `np.vstack()`, `np.hstack()`, `np.dstack()`, `np.r_`和`np.c_`。 ```python # 创建两个数组进行演示 array1 = np.array([[1, 2], [3, 4]]) array2 = np.array([[5, 6], [7, 8]]) # 使用concatenate进行水平合并 horizontal = np.concatenate((array1, array2), axis=1) print(horizontal) # 输出: [[1 2 5 6] [3 4 7 8]] # 使用concatenate进行垂直合并 vertical = np.concatenate((array1, array2), axis=0) print(vertical) # 输出: [[1 2] [3 4] [5 6] [7 8]] # 使用split拆分数组 split_horizontal = np.split(horizontal, 2, axis=1) print(split_horizontal) # 输出: [array([[1, 2]]), array([[5, 6], [3, 4], [7, 8]])] # 使用vstack和hstack进行垂直和水平堆叠 vstack_example = np.vstack((array1, array2)) hstack_example = np.hstack((array1, array2)) print(vstack_example) # 输出: # [[1 2] # [3 4] # [5 6] # [7 8]] print(hstack_example) # 输出: # [[1 2 5 6] # [3 4 7 8]] ``` 在上述代码中，`concatenate`函数用于连接多个数组，`split`用于将一个数组拆分成多个子数组。`vstack`和`hstack`是两个非常便捷的函数，分别用于垂直和水平堆叠数组。 ### 2.2 高级操作 #### 2.2.1 广播规则的理解与应用 NumPy的广播规则允许不同形状的数组进行算术运算。这个机制虽然强大，但也需要仔细理解和掌握。 ```python # 创建一个形状为(3, 3)的数组 array_3x3 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) # 创建一个形状为(3,)的一维数组 array_1d = np.array([1, 2, 3]) # 利用广播进行运算 result = array_3x3 + array_1d print(result) # 输出: # [[ 2 4 6] # [ 5 7 9] # [ 8 10 12]] ``` 在这个例子中，一维数组`array_1d`与二维数组`array_3x3`相加。根据广播规则，一维数组沿着第二个轴（列方向）被扩展，最终形成了形状为(3, 3)的数组，使得每个元素都与`array_3x3`中的对应元素相加。 #### 2.2.2 数组的转置和轴交换数组的转置和轴交换可以让我们重新排列数组的维度。这对于很多数据分析和处理任务来说非常重要。 ```python # 创建一个形状为(3, 4)的数组 array = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]) # 使用transpose进行转置 transpose_result = array.T print(transpose_result) # 输出: # [[ 1 5 9] # [ 2 6 10] # [ 3 7 11] # [ 4 8 12]] # 使用swapaxes交换特定的轴 swapaxes_result = np.swapaxes(array, 0, 1) print(swapaxes_result) # 输出: # [[ 1 5 9] # [ 2 6 10] # [ 3 7 11] # [ 4 8 12]] ``` `transpose`函数返回输入数组的转置版本，而`swapaxes`函数则交换输入数组的两个轴。 ### 2.3 数组的视图与副本 #### 2.3.1 视图的概念与创建方法视图允许我们以不同的方式查看数据而不复制数据本身。创建视图是创建数组时节约内存的有效方式。 ```python # 创建一个数组 original = np.array([1, 2, 3, 4]) # 创建视图 view = original.view() print(view.base) # 输出原始数组，因为视图共享数据 # 输出: [1 2 3 4] # 修改视图，原始数组也会改变 view[1] = 100 print(original) # 输出: [ 1 100 3 4] ``` 在这个例子中，我们通过`view()`函数创建了一个数组的视图。视图对象的`base`属性指向原始数组，说明视图并没有复制原始数组的数据。 #### 2.3.2 副本的创建与性能考量副本是指完全独立的数据副本。当你需要在修改数据时不影响原始数据时，应创建副本。 ```python # 创建一个数组 original = np.array([1, 2, 3, 4]) # 创建副本 copy = original.copy() print(copy.base) # 输出None，因为副本不共享数据 # 输出: None # 修改副本，原始数组保持不变 copy[1] = 100 print(original) # 输出: [1 2 3 4] print(copy) # 输出: [ 1 100 3 4] ``` 通过`copy()`函数，我们创建了`original`数组的一个副本。副本的`base`属性为`None`，表示它不依赖于任何原始数组。副本创建时会消耗额外的内存，但它允许我们自由修改数据而不影响原始数组。在性能考量方面，视图通常比副本更高效，因为它们不涉及数据的复制。然而，使用视图时必须小心，因为对视图的任何修改都会反映到原始数组中。在实际应用中，需要根据具体需求选择创建视图还是副本。 # 3. NumPy在金融数据分析中的应用 ## 3.1 数据预处理 ### 3.1.1 缺失值处理在金融数据分析中，面对真实世界的数据集，我们经常会遇到含有缺失值的数据。缺失值可能是因为数据收集不完整、数据传输错误或者其他多种原因造成。处理这些缺失值对于确保数据质量和后续分析的准确性至关重要。 NumPy提供了一系列方法来处理缺失值。最常见的方法是使用NumPy数组的`np.isnan()`函数来检测缺失值，并通过数组的索引和切片技术对缺失值进行填充或删除。例如，我们可以使用数组的均值、中位数、众数或者通过插值方法来填充缺失值。下面是一个具体的示例，演示如何使用NumPy处理含有缺失值的金融数据集： ```python import numpy as np # 创建一个含有缺失值的数组 data = np.array([1, 2, np.nan, 4, 5]) # 使用均值填充缺失值 data_filled_with_mean = np.where(np.isnan(data), np.nanmean(data), data) # 删除含有缺失值的行（如果数据是二维数组） data_without_missing = data[~np.isnan(data).any(axis=1)] ``` 在这里，`np.isnan()`函数返回一个布尔数组，其中缺失值的位置为True。`np.nanmean()`函数计算数组中非NaN值的平均值。`np.where()`函数将满足条件的元素替换为指定值，在这个案例中，我们用数组的均值替换NaN值。 ### 3.1.2 数据标准化与归一化在金融数据分析中，数据标准化和归一化是重要的预处理步骤，用于消除不同量纲的影响，使得数据更适用于后续的统计分析和模型构建。数据标准化通常指的是将数据按比例缩放，使之落入一个小的特定区间，比如将数据缩放到[0,1]。而数据归一化则常指将数据按比例缩放，使之落入一个标准正态分布，即均值为0，标准差为1。 NumPy提供了多种函数来支持这些操作。例如，`np.min()`和`np.max()`可以找到数组中的最小值和最大值，从而可以帮助我们实现数据的归一化。 ```python from sklearn.preprocessing import MinMaxScaler # 假设我们有一个金融数据集 financial_data = np.array([500, 2500, 1000, 1200]) # 创建一个归一化器对象 scaler = MinMaxScaler() # 将数据归一化到[0,1]区间 normalized_data = scaler.fit_transform(financial_data.reshape(-1, 1)) print(normalized_data) ``` 在这个例子中，我们使用了`MinMaxScaler`，这是`scikit-learn`库提供的一个实用工具，它可以方便地对数据进行标准化处理。虽然这不是NumPy原生函数，但`scikit-learn`构建在NumPy之上，且广泛应用于数据分析中，因此值得提及。通过这些方法，我们可以确保金融数据集在进行进一步分析之前，已经处于最佳的格式和尺度。 ## 3.2 金融数据的统计分析 ### 3.2.1 描述性统计描述性统计是对数据集的集中趋势、分散程度等特征的总结和描述。在金融数据分析中，描述性统计是非常重要的，因为它可以帮助分析师快速了解数据的总体特征，为深入分析打下基础。 NumPy提供了很多函数来进行描述性统计，如`np.mean()`计算平均值，`np.median()`计算中位数，`np.std()`计算标准差等。 ```python import numpy as np # 示例数组 stock_prices = np.array([120.5, 121.5, 122.5, 123.5, 124.5]) # 平均值 mean_price = np.mean(stock_prices) # 中位数 median_price = np.median(stock_prices) # 标准差 std_deviation = np.std(stock_prices) print(f"Mean: {mean_price}, Median: {median_price}, Standard Deviation: {std_deviation}") ``` 此外，我们还可以计算偏度（skewness）和峰度（kurtosis），这些是衡量数据分布形态的指标。NumPy本身不提供直接计算偏度和峰度的函数，但我们可以利用`scipy.stats`模块来实现： ```python from scipy.stats import skew, kurtosis skewness = skew(stock_prices) kurt = kurtosis(stock_prices) print(f"Skewness: {skewness}, Kurtosis: {kurt}") ``` ### 3.2.2 相关性分析相关性分析是评估两个或多个变量之间线性关系强度和方向的过程。在金融领域，我们经常需要分析不同金融资产之间的相关性，以便于进行有效的投资组合管理。 NumPy提供了`np.corrcoef()`函数来计算数据集中变量之间的相关系数矩阵。该函数返回一个相关系数矩阵，其中对角线元素是变量与自身的相关系数（总是1），非对角线元素是两两变量之间的相关系数。 ```python import numpy as np # 两支股票的历史价格数据 stock_a_prices = np.array([100, 102, 103, 101, 104]) stock_b_prices = np.array([200, 204, 203, 201, 205]) # 计算相关系数矩阵 correlation_matrix = np.corrcoef(stock_a_prices, stock_b_prices) print(correlation_matrix) ``` 通过分析相关系数矩阵，我们可以确定哪些资产之间存在强相关性，哪些资产之间存在弱相关性或负相关性。这对于投资组合多样化和风险控制是极其重要的。 ## 3.3 金融模型的构建 ### 3.3.1 时间序列分析时间序列分析是金融市场分析中的核心方法之一，它包括对金融时间序列数据的建模、预测和控制。NumPy在时间序列分析中扮演着基础的角色，虽然高级的时间序列分析往往需要专门的库，如`statsmodels`或`pandas`。时间序列数据的一个典型特征是它的自相关性，即过去的值与未来的值之间存在某种相关关系。NumPy可以用来计算自相关系数，它衡量的是时间序列与其自身的滞后版本之间的相关性。 ```python import numpy as np # 一个简单的时间序列数据 time_series = np.array([1, 2, 3, 4, 5]) # 计算自相关系数 def autocorrelation(x): n = x.size mean_x = np.mean(x) autocorr = np.correlate(x - mean_x, x - mean_x, mode='full') return autocorr[n-1:] / autocorr[n-1] autocorr_values = autocorrelation(time_series) print(autocorr_values) ``` ### 3.3.2 风险评估与预测模型在金融分析中，风险评估是不可或缺的一环。常见的风险评估指标包括波动率、β系数、夏普比率等。此外，预测模型如自回归移动平均模型（ARMA）和广义自回归条件异方差模型（GARCH）等，也是分析金融市场风险的重要工具。在本章中，我们将重点关注如何使用NumPy构建简单的风险评估模型。例如，我们可以使用NumPy来计算投资组合的年化波动率，这是一种衡量投资风险的常用指标。 ```python import numpy as np # 假设我们有一个股票收益数据集 stock_returns = np.array([0.01, 0.02, -0.01, 0.03, -0.02]) # 计算年化波动率 annual_volatility = np.std(stock_returns) * np.sqrt(252) print(f"Annual Volatility: {annual_volatility}") ``` 在这个例子中，我们使用了日收益率数据，并计算了其标准差。然后，我们将标准差乘以年化因子（√252），得到了年化波动率。这个指标可以帮助我们评估投资的潜在风险。 NumPy在构建金融风险评估和预测模型中的应用虽然相对简单，但它是建立更复杂模型和进行高级分析的基石。通过掌握NumPy中的这些基本技术，我们可以为进一步的金融模型构建奠定坚实的基础。 # 4. NumPy进阶主题 ## 4.1 高性能计算在数据科学和金融分析领域，处理大规模数据集是日常工作的常态。因此，对计算性能有着极高的要求。NumPy作为一个强大的数学库，提供了多种方式来实现高性能计算。本节将详细介绍并行计算的基础以及如何利用NumPy实现向量化运算，以提高计算效率。 ### 4.1.1 并行计算基础并行计算是提高计算性能的重要手段之一，它允许同时使用多个计算资源来解决问题。在Python中，可以使用多种方法实现并行计算，比如多线程和多进程。然而，NumPy通过向量化操作已经实现了部分并行计算的能力，这是因为它可以利用底层的C和Fortran库来加速计算。并行计算的一个关键概念是线程和进程。线程是操作系统能够进行运算调度的最小单位，它被包含在进程之中，是进程中的实际运作单位。进程则是计算机中的程序关于某数据集合上的一次运行活动，是系统进行资源分配和调度的一个独立单位。在NumPy中，大部分的操作都是通过向量化操作来实现的，这意味着数组的每个元素都几乎是并行处理的。例如，两个相同形状的数组的元素相加操作就是并行进行的，因为每个元素的加法操作是相互独立的。 ### 4.1.2 利用NumPy实现向量化运算向量化运算是一种使用数组运算来替代循环的方法，它可以大幅提高代码的执行效率。向量化操作不需要显式编写循环结构，NumPy库自动将数组操作转换为优化过的底层代码。例如，考虑以下Python代码，它使用传统的循环来计算两个数组对应元素的乘积： ```python import numpy as np # 创建两个大数组 a = np.random.rand(1000000) b = np.random.rand(1000000) # 使用循环进行元素乘法 c = np.empty(a.shape) for i in range(len(a)): c[i] = a[i] * b[i] # 使用向量化操作 d = a * b ``` 在上面的代码中，使用循环的计算方法比向量化操作慢得多，因为它没有利用NumPy的底层优化。向量化操作`d = a * b`则是利用了NumPy的内部优化，实现了更高的计算效率。在实际应用中，NumPy通过以下方式提高计算性能： - **内部优化**：NumPy通过优化的C和Fortran代码来提高性能。 - **内存布局优化**：NumPy数组的内存布局是连续的，这使得CPU缓存更高效地利用，加快了数据的存取速度。 - **并行执行**：NumPy的一些操作在多核处理器上可以并行执行，尤其是在使用了Intel MKL数学核心库的环境中。 NumPy的向量化操作是如此有效，以至于在很多情况下，使用Python和NumPy进行数值计算的性能几乎可以与编译语言如C或Fortran相媲美。 ## 4.2 高级索引与掩码高级索引是NumPy中的一个强大工具，允许用户根据复杂的条件选择数据子集。它不仅限于简单的整数或布尔索引，还可以使用数组或数组的组合进行索引。这在处理复杂的数据结构时特别有用。 ### 4.2.1 结构化数组和记录数组结构化数组是NumPy数组的扩展形式，它允许数组中的每个元素包含多种数据类型，类似于数据库中的记录。结构化数组特别适合于存储表格数据，其中每列可以有不同的数据类型。例如，假设我们要存储以下信息： - 姓名：字符串类型 - 身高：浮点类型 - 年龄：整数类型我们可以创建一个结构化数组，如下所示： ```python import numpy as np # 定义数据类型 dtype = [('name', 'U10'), ('height', float), ('age', int)] # 创建结构化数组 data = [('Alice', 1.65, 30), ('Bob', 1.82, 22), ('Charlie', 1.75, 25)] # 将数据转换为结构化数组 struct_array = np.array(data, dtype=dtype) ``` 在这个结构化数组中，我们可以使用字段名来索引数据： ```python # 使用字段名索引 names = struct_array['name'] ages = struct_array['age'] ``` ### 4.2.2 布尔索引和掩码的高级应用布尔索引是一种根据布尔值数组（True或False）来选择数组元素的技术。在NumPy中，布尔索引与掩码的概念密切相关。掩码是一个布尔数组，表示数组中元素是否被选中，而布尔索引则是根据这个掩码来进行元素选择。例如，我们有一个数组`a`，我们想选择所有大于0.5的元素： ```python import numpy as np # 创建一个随机数组 a = np.random.rand(10) # 创建一个布尔掩码 mask = a > 0.5 # 使用掩码进行布尔索引 selected_elements = a[mask] ``` 布尔索引不仅可以用于一维数组，也可以用于多维数组。在多维数组中，掩码数组的每个位置可以表示原数组中一个元素是否被选中，从而实现复杂的索引操作。 NumPy中还提供了`np.where`函数，该函数可以用来获取满足条件的元素的索引。例如： ```python # 使用np.where获取满足条件的元素索引 indices = np.where(a > 0.5) ``` 这将返回一个元组，其中包含了满足条件`a > 0.5`的元素在原数组中的索引。在性能方面，布尔索引和掩码使用了高效的数组操作和内存访问模式，这使得它们在处理大型数据集时比使用Python循环更加高效。 ## 4.3 NumPy与其他库的交互 NumPy是Python数据分析生态中的基石，它与其他库有着紧密的集成。这些库包括但不限于Pandas用于数据分析，Matplotlib用于数据可视化等。NumPy与这些库的交互使得整个数据处理流程更加顺畅。 ### 4.3.1 与Pandas的集成 Pandas是一个强大的数据分析库，它提供了一种称为DataFrame的二维标签化数据结构，可以理解为一个表格或者说是NumPy结构化数组的一个特化版本。Pandas与NumPy之间的集成非常紧密，因为它们的数据结构在很多方面是互补的。 Pandas的Series和DataFrame对象都是建立在NumPy的NDArray之上的，这意味着它们可以很容易地与NumPy的数组操作相互转换。例如，我们可以将Pandas的DataFrame转换为NumPy数组： ```python import pandas as pd import numpy as np # 创建一个Pandas DataFrame df = pd.DataFrame({'a': np.random.rand(5), 'b': np.random.rand(5)}) # 将DataFrame转换为NumPy数组 array = df.values ``` 反之，我们也可以将NumPy数组转换为Pandas DataFrame： ```python # 将NumPy数组转换为DataFrame df = pd.DataFrame(array, columns=['A', 'B']) ``` 在数据处理过程中，这样的转换可以非常方便地利用NumPy的强大计算能力以及Pandas在数据处理方面的便捷性。 ### 4.3.2 与Matplotlib的数据可视化结合 Matplotlib是一个用于创建静态、动画和交互式可视化的库。在数据可视化的过程中，经常需要处理大量的数据点和复杂的图表。NumPy与Matplotlib的结合可以使得这样的任务变得更加高效和便捷。在Matplotlib中绘制图表时，通常需要处理大量数值数据。NumPy数组可以作为数据输入直接传递给Matplotlib的绘图函数，例如： ```python import matplotlib.pyplot as plt import numpy as np # 创建NumPy数组 x = np.linspace(0, 10, 100) y = np.sin(x) # 使用Matplotlib绘制图表 plt.plot(x, y) plt.show() ``` 这里，`np.linspace`函数生成了一个等差数列数组，代表x轴的数据点，而`np.sin`函数则生成了对应的y轴数据。这些数据随后被直接传递给`plt.plot`函数来绘制正弦曲线。 NumPy的灵活性和性能优势使得其在与Matplotlib结合使用时，可以轻松处理大规模数据集，并且提供高性能的绘图能力，这对于金融分析中复杂的可视化任务至关重要。 ## 总结 NumPy是数据科学中不可或缺的库之一，尤其是在金融分析领域，其高性能计算、高级索引与掩码以及与其他库的交互能力，为复杂的数据处理和分析提供了坚实的基础。通过本章节的介绍，我们了解了如何利用NumPy的并行计算和向量化运算来提高计算性能，探讨了高级索引和掩码技术，以及如何将NumPy与其他重要库如Pandas和Matplotlib集成，以实现数据分析和可视化的无缝对接。这些知识对于构建高效和强大的金融数据分析工具至关重要。 # 5. 实践案例分析 ## 5.1 股票市场数据分析 ### 5.1.1 数据获取与清洗在股票市场数据分析的环节中，数据的获取和清洗是至关重要的第一步。我们通常从金融市场数据库中，例如Yahoo Finance、Google Finance等，获取历史股价数据。这些数据通常包含开盘价、最高价、最低价、收盘价以及成交量等信息。 ```python import pandas as pd # 从Yahoo Finance下载股票数据 stock_data = pd.DataFrame(pd.read_csv('stock_data.csv')) print(stock_data.head()) ``` 在数据清洗过程中，我们可能需要处理缺失值、去除重复数据、转换数据类型等。以去除重复数据为例： ```python # 去除重复的数据 stock_data = stock_data.drop_duplicates() ``` 数据清洗后，我们应该进行数据类型转换，确保数据的准确性： ```python # 转换数据类型为float，以避免后续计算中出现问题 for col in ['Open', 'High', 'Low', 'Close', 'Volume']: stock_data[col] = stock_data[col].astype('float') ``` ### 5.1.2 股价趋势分析与预测股价趋势分析主要关注股价的历史波动，并通过这些波动来预测未来的趋势。这通常涉及到绘制股价走势图和计算技术指标。 ```python import matplotlib.pyplot as plt # 绘制股票收盘价走势图 plt.figure(figsize=(10,5)) plt.plot(stock_data['Close'], label='Close Price') plt.title('Stock Close Price') plt.xlabel('Date') plt.ylabel('Close Price') plt.legend() plt.show() ``` 预测未来股价通常使用技术分析，例如移动平均线、相对强弱指数（RSI）等。我们也可以应用统计模型进行预测，比如ARIMA模型。 ```python from statsmodels.tsa.arima.model import ARIMA # 应用ARIMA模型进行股价预测 model = ARIMA(stock_data['Close'], order=(5,1,0)) model_fit = model.fit() forecast = model_fit.forecast(steps=5) print(forecast) ``` ## 5.2 金融风险管理 ### 5.2.1 风险值（VaR）的计算风险值（Value at Risk，简称VaR）是金融领域中衡量金融风险的一种方法，用来预测一定时间内、一定置信水平下的最大损失。计算VaR的常用方法有历史模拟法、方差-协方差法和蒙特卡洛模拟法。 ```python # 假设我们已经有了每日收益率数据 returns = stock_data['Daily_Returns'] # 计算VaR - 历史模拟法 var = -returns.quantile(0.05) print(f"VaR (95% Confidence) for the next day is: {var}") ``` ### 5.2.2 资产组合优化策略资产组合优化的目标是在一定的风险水平下获取最大的预期收益。现代投资组合理论中的均值-方差模型可以用来解决这一问题。该模型基于风险和收益的权衡，来计算最优的资产配置。 ```python import numpy as np import cvxpy as cp # 假设我们有不同资产的预期收益率和协方差矩阵 expected_returns = np.array([0.001, 0.002, 0.003]) cov_matrix = np.array([[0.0001, 0.00001, 0.00001], [0.00001, 0.0002, 0.00001], [0.00001, 0.00001, 0.0003]]) # 计算最优资产配置 weights = cp.Variable(len(expected_returns)) ret = expected_returns @ weights risk = cp.quad_form(weights, cov_matrix) prob = cp.Problem(cp.Maximize(ret - 0.01 * risk), [cp.sum(weights) == 1, weights >= 0]) # 求解问题 prob.solve() print("Optimal weights: ", weights.value) ``` 这个模型可以进一步扩展，比如考虑交易成本、税收、流动性约束等多种因素，以适应更复杂的实际情况。

最低0.47元/天解锁专栏

买1年送3月

点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

【Python金融数据分析基础】NumPy基础：数组操作与计算

相关推荐

专栏目录

【Python金融数据分析基础】NumPy基础：数组操作与计算

相关推荐

【数据处理与科学计算】Numpy数组高级操作指南：从基础到实战的全面解析

Python数据分析实践：NumPy数组常用操作new.pdf

Python Numpy深入解析：数组array与矩阵matrix

快速掌握Python NumPy基础：数组操作与应用

Python numpy基础：高效数组操作与科学计算应用

Numpy性能对比：数组计算速度提升的关键

Python数据分析入门：Numpy数组与科学计算操作详解

Python Numpy基础教程：掌握多维数组操作

Numpy与Pandas基础教程：数组操作与矩阵运算

专栏目录

最新推荐

【UNmult插件的用户反馈深度分析】：评价背后的权威解读

跨平台配置专家：GMSL GUI CSI工具在各系统中的安装与优化

【振动测试与维护策略】：IEC 60068-2-64标准在IT设备维护中的关键作用

WMS内存管理优化：专家指南减少资源消耗的实用技巧

API网关设计策略：微服务架构的通信保障指南

【故障恢复策略】：Kubernetes v1.30集群数据备份与灾难恢复指南

C++对象序列化全解析：保存与读取对象状态的高级技巧

【Kyber算法标准化之路】：NIST竞赛中的选择与未来展望

LuGre摩擦模型在机械振动分析中的核心作用：故障诊断与补偿

电赛H题：基于云平台的自动驾驶小车数据管理，云平台数据管理的未来趋势