vectorbt学习_04StopSignals

学习笔记

OHLCSTX.run生成各类退出信号#

退出信号：
平仓(卖出)的方式，最简单的，相对买入价的固定比例止损，
止损：比如，相比买入价下跌10%就卖出。
跟踪止损：相比持有期间的最高价，下跌10%就卖出。
止盈：比如，相比买入价，上涨达到10%就卖出，落袋为安。
超时退出：买入最多持有10天，10天到期后强制卖出。
以上退出信号未必100%达成(触发)，如果价格波动非常小，有可能一直不会被触发，退化为持续持有策略。

稍微复杂的是OHLCSTX相关代码
先参考官方文档中关于：OHLCSTX的内容：https://vectorbt.dev/api/signals/generators/#vectorbt.signals.generators.OHLCSTX
函数原型

1
OHLCSTX.run(
2
    entries,
3
    open,
4
    high,
5
    low,
6
    close,
7
    sl_stop=Default(nan), #止损
8
    sl_trail=Default(False),#跟踪止损
9
    tp_stop=Default(nan),#止盈
10
    reverse=Default(False),
11
    stop_price=nan,#In-place output array.
12
    stop_type=-1,#In-place output array.
13
    short_name='ohlcstx',
14
    hide_params=None,
15
    hide_default=True,
16
    **kwargs
17
)

参考官方demo简单分析下

1
entries = pd.Series([True, False, False, False, False, False])
2
price = pd.DataFrame({
3
    'open': [10, 11, 12, 11, 10, 9],
4
    'high': [11, 12, 13, 12, 11, 10],
5
    'low': [9, 10, 11, 10, 9, 8],
6
    'close': [10, 11, 12, 11, 10, 9]
7
})
8
ohlcstx = vbt.OHLCSTX.run(
9
    entries,
10
    price['open'], price['high'], price['low'], price['close'],
11
    sl_stop=[0.1, 0.1, np.nan],
12
    sl_trail=[False, True, False],
13
    tp_stop=[np.nan, np.nan, 0.1])
14

15
这里的：
16
sl_stop=[0.1, 0.1, np.nan],
17
sl_trail=[False, True, False],
18
tp_stop=[np.nan, np.nan, 0.1]
19
对应了3种退出策略
20
sl_stop=[0.1,
21
sl_trail=[False,
22
tp_stop=[np.nan,
23
=》
24
止损幅度：0.1
25
止损：固定止损（非跟踪止损）
26
止盈幅度：0.1
27

28

29
sl_stop=[0.1,
30
sl_trail=[True,
31
tp_stop=[np.nan
32
=》
33
止损幅度：0.1
34
止损：跟踪止损
35
止盈幅度：无
36

37
sl_stop= np.nan],
38
sl_trail= False],
39
tp_stop= 0.1]
40
=》
41
止损幅度：无
42
止损：无
43
止盈幅度：0.1

参考上面含义解析，理解下面的信号结果output
直角方块：固定止损0.1，close=10，止损价9，所以最终退出价格为9，原因为止损退出
椭圆部分：跟踪止损0.1，high=13，止损价11.7，所以最终退出价格为11.7，原因为跟踪止损退出
圆角方框：无止损，止盈价10*1.1=11，所以最终退出价格为11，原因止盈退出

del01

1
sl_exits = vbt.OHLCSTX.run(
2
    entries,
3
    ohlcv['Open'],
4
    ohlcv['High'],
5
    ohlcv['Low'],
6
    ohlcv['Close'],
7
    sl_stop=list(stops),
8
    stop_type=None,
9
    stop_price=None
10
).exits
11
ts_exits = vbt.OHLCSTX.run(
12
    entries,
13
    ohlcv['Open'],
14
    ohlcv['High'],
15
    ohlcv['Low'],
16
    ohlcv['Close'],
17
    sl_stop=list(stops),
18
    sl_trail=True,
19
    stop_type=None,
20
    stop_price=None
21
).exits
22
tp_exits = vbt.OHLCSTX.run(
23
    entries,
24
    ohlcv['Open'],
25
    ohlcv['High'],
26
    ohlcv['Low'],
27
    ohlcv['Close'],
28
    tp_stop=list(stops),
29
    stop_type=None,
30
    stop_price=None
31
).exits
32

33
# 这3行代码原因参考下图数据的索引结构，目的是让多重索引保持对齐
34
sl_exits.vbt.rename_levels({'ohlcstx_sl_stop': 'stop_value'}, inplace=True)
35
ts_exits.vbt.rename_levels({'ohlcstx_sl_stop': 'stop_value'}, inplace=True)
36
tp_exits.vbt.rename_levels({'ohlcstx_tp_stop': 'stop_value'}, inplace=True)
37
ts_exits.vbt.drop_levels('ohlcstx_sl_trail', inplace=True)

del01

不同方式的退出信号达成率#

信号达成率<退出是否被触发>，比如止损5%，但是行情一直1%内波动，则信号不会被触发。

继续分析如下代码块

1
print(pd.Series({
2
    'SL': sl_exits.vbt.signals.total().mean(),
3
    'TS': ts_exits.vbt.signals.total().mean(),
4
    'TP': tp_exits.vbt.signals.total().mean()
5
}, name='avg_num_signals'))
6

7
SL    0.117000 #止损退出方式下，信号的平均达成率（成功固定止损）
8
TS    0.184667 #跟踪止损方式下，信号的平均达成率（成功跟踪止损）
9
TP    0.204750 #止盈方式下，信号的平均达成率（成功止盈）
10
Name: avg_num_signals, dtype: float64
11

12
pd.DataFrame({
13
    'Stop Loss': sl_exits.vbt.signals.total().groupby('stop_value').mean(),
14
    'Trailing Stop': ts_exits.vbt.signals.total().groupby('stop_value').mean(),
15
    'Take Profit': tp_exits.vbt.signals.total().groupby('stop_value').mean()
16
}).vbt.plot(xaxis_title='Stop value', yaxis_title='Avg number of signals').show_svg()

del01

以 ‘Stop Loss’: sl_exits.vbt.signals.total().groupby(‘stop_value’).mean(),为例. sl_exits退出方式下，stop_value从0.01->0.99不同取值下，对应的，达成率
所以：随着stop_value从小到大，分别意味着价格要下探到0.99,0.98 -> 0.01才能触发信号止损，故越靠右侧，曲线越接近与0
takeProfit线，就更明显了，止盈取值遇到，信号达成率越低。

merge期末强制退出信号#

持有到期后（最后一天），生成卖出信号，强制卖出。

1
sl_exits.iloc[-1, :] = True # 强制周期末尾退出信号为True，所以可能存在2个True情况
2
ts_exits.iloc[-1, :] = True
3
tp_exits.iloc[-1, :] = True
4

5
# Select one exit between two entries
6
sl_exits = sl_exits.vbt.signals.first(reset_by=entries, allow_gaps=True)# 2个True情况下，取得第一个True
7
ts_exits = ts_exits.vbt.signals.first(reset_by=entries, allow_gaps=True)
8
tp_exits = tp_exits.vbt.signals.first(reset_by=entries, allow_gaps=True)
9

10
print(pd.Series({
11
    'SL': sl_exits.vbt.signals.total().mean(),# 由于每个标的的每个周期，都有且只有一个True信号，所以取值为1
12
    'TS': ts_exits.vbt.signals.total().mean(),
13
    'TP': tp_exits.vbt.signals.total().mean()
14
}, name='avg_num_signals'))
15

16
SL    1.0
17
TS    1.0
18
TP    1.0
19
Name: avg_num_signals, dtype: float64

持有到期hold_exits,随机退出rand_exits#

1
hold_exits = pd.DataFrame.vbt.signals.empty_like(sl_exits)
2
hold_exits.iloc[-1, :] = True #买入并持有到期末的退出信号
3

4
print(hold_exits.shape)
5
rand_exits = hold_exits.vbt.shuffle(seed=seed)#随机卖出的退出信号
6

7
print(rand_exits.shape)

退出信号融合到columns.multiIndex#

1
exits = pd.DataFrame.vbt.concat(
2
    sl_exits,
3
    ts_exits,
4
    tp_exits,
5
    rand_exits,
6
    hold_exits,
7
    keys=pd.Index(exit_types, name='exit_type') #exit_types = ['SL', 'TS', 'TP', 'Random', 'Holding']
8
)
9

10
print(exits.shape)
11
(180, 60000)
12

13
print(exits.columns)
14
MultiIndex([(     'SL', 0.01,  0, '510050.XSHG'),
15
            (     'SL', 0.01,  0, '510300.XSHG'),
16
            (     'SL', 0.01,  0, '159901.XSHE'),
17
            (     'SL', 0.01,  1, '510050.XSHG'),
18
            (     'SL', 0.01,  1, '510300.XSHG'),
19
            (     'SL', 0.01,  1, '159901.XSHE'),
20
            (     'SL', 0.01,  2, '510050.XSHG'),
21
            (     'SL', 0.01,  2, '510300.XSHG'),
22
            (     'SL', 0.01,  2, '159901.XSHE'),
23
            (     'SL', 0.01,  3, '510050.XSHG'),
24
            ...
25
            ('Holding',  1.0, 36, '159901.XSHE'),
26
            ('Holding',  1.0, 37, '510050.XSHG'),
27
            ('Holding',  1.0, 37, '510300.XSHG'),
28
            ('Holding',  1.0, 37, '159901.XSHE'),
29
            ('Holding',  1.0, 38, '510050.XSHG'),
30
            ('Holding',  1.0, 38, '510300.XSHG'),
31
            ('Holding',  1.0, 38, '159901.XSHE'),
32
            ('Holding',  1.0, 39, '510050.XSHG'),
33
            ('Holding',  1.0, 39, '510300.XSHG'),
34
            ('Holding',  1.0, 39, '159901.XSHE')],
35
           names=['exit_type', 'stop_value', 'split_idx', 'symbol'], length=60000)
36

37
#可见vbt.concat实际效果是增加multiindex的维度，将各维度融合到一起
38
#新增了一个列的mulitindex，列明exit_type，取值
39
#sl_exits=》exit_types[0]='SL',
40
#ts_exits=》exit_types[1]='TS',
41
#tp_exits=》exit_types[2]='TP',

各退出方式,退出价对应持仓周期#

1
avg_distance = entries.vbt.signals.between_ranges(other=exits)\
2
    .duration.mean()\ #买入信号(为true)和卖出信号(为true)的距离的平均
3
    .groupby(['exit_type', 'stop_value'])\ #根据退出类型和止损(退出)价格聚类
4
    .mean()\ #聚类后平均
5
    .unstack(level='exit_type')
6

7
print(avg_distance.mean())
8
exit_type
9
Holding    179.000000
10
Random      88.964167
11
SL         164.050500
12
TP         158.039583
13
TS         155.407917
14
dtype: float64

关于between_ranges，参考：https://vectorbt.dev/api/signals/accessors/#vectorbt.signals.accessors.SignalsAccessor.between_ranges
对于单列比对
del01

对于2列比对
del01

可视化

1
avg_distance[exit_types].vbt.plot(
2
    xaxis_title='Stop value',
3
    yaxis_title='Avg distance to entry'
4
).show_svg()

可见随机类型的平均持仓周期约为100，符合理论，随着Stop value的增大，持仓周期增大，意味着价格条件越苛刻，满足条件的标的越少，符合直观理解。
del01

各退出类型对应的收益率#

1
# del pf
2

3
from tqdm.auto import tqdm
4
import gc
5

6
total_returns = []
7

8
for i in tqdm(range(len(exit_types))):
9
    chunk_mask = exits.columns.get_level_values('exit_type') == exit_types[i]
10
    chunk_exits = exits.loc[:, chunk_mask]
11
    chunk_pf = vbt.Portfolio.from_signals(ohlcv['Close'], entries, chunk_exits)
12
    total_returns.append(chunk_pf.total_return())
13

14
    del chunk_pf
15
    gc.collect()
16

17
total_return = pd.concat(total_returns)
18
total_return
19

20
exit_type  stop_value  split_idx  symbol
21
SL         0.01        0          510050.XSHG   -0.048341
22
                                  510300.XSHG   -0.030499
23
                                  159901.XSHE   -0.050584
24
                       1          510050.XSHG   -0.028360
25
                                  510300.XSHG   -0.035368
26
                                                   ...
27
Holding    1.00        38         510300.XSHG    0.387240
28
                                  159901.XSHE    0.475174
29
                       39         510050.XSHG    0.348895
30
                                  510300.XSHG    0.409675
31
                                  159901.XSHE    0.532666
32
Name: total_return, Length: 60000, dtype: float64
33

34
print(total_return.shape)
35
(60000,)

绘制特定类型的收益率分布

1
total_return_by_type = total_return.unstack(level='exit_type')[exit_types]

del01

1
print(total_return_by_type['Holding'].describe(percentiles=[]))
2

3
count    12000.000000
4
mean         0.105666
5
std          0.189775
6
min         -0.331357
7
50%          0.120410
8
max          0.532666
9
Name: Holding, dtype: float64
10

11

12
total_return_by_type['SL'].vbt.histplot(
13
    xaxis_title='Total return',
14
    xaxis_tickformat='%',
15
    yaxis_title='Count',
16
    trace_kwargs=dict(marker_color=vbt.settings['plotting']['color_schema']['purple'])
17
).show_svg()

del01

由于这个数据是stopvalue止损价从0.01->0.99的总体统计，感觉说明不了什么。

各退出方式收益率分位图#

1
print(pd.DataFrame({
2
    'Mean': total_return_by_type.mean(),
3
    'Median': total_return_by_type.median(),
4
    'Std': total_return_by_type.std(),
5
}))
6
            Mean    Median       Std
7
exit_type
8
SL         0.093459  0.103322  0.189059
9
TS         0.085152  0.094196  0.184434
10
TP         0.091800  0.104270  0.177477
11
Random     0.031920  0.013198  0.142426
12
Holding    0.105666  0.120410  0.189775
13

14
total_return_by_type.vbt.boxplot(
15
    yaxis_title='Total return',
16
    yaxis_tickformat='%'
17
).show_svg()

del01

各退出方式胜率#

1
print((total_return_by_type > 0).mean().rename('win_rate'))
2
exit_type
3
SL         0.673667
4
TS         0.656500
5
TP         0.740917
6
Random     0.548500
7
Holding    0.733333
8
Name: win_rate, dtype: float64

不同止损方式在不同止损价位上的预期收益(期望收益)#

1
init_cash = vbt.settings.portfolio['init_cash']
2

3
def get_expectancy(total_return_by_type, level_name):
4
    grouped = total_return_by_type.groupby(level_name, axis=0)
5
    win_rate = grouped.apply(lambda x: (x > 0).mean())
6
    avg_win = grouped.apply(lambda x: init_cash * x[x > 0].mean()).fillna(0)
7
    avg_loss = grouped.apply(lambda x: init_cash * x[x < 0].mean()).fillna(0)
8
    return win_rate * avg_win - (1 - win_rate) * np.abs(avg_loss)
9

10
expectancy_by_stop = get_expectancy(total_return_by_type, 'stop_value')
11

12
print(expectancy_by_stop.mean())
13
exit_type
14
SL          9.345944
15
TS          8.515217
16
TP          9.180045
17
Random      3.128960
18
Holding    10.566559
19
dtype: float64
20

21
expectancy_by_stop.vbt.plot(
22
    xaxis_title='Stop value',
23
    yaxis_title='Expectancy'
24
).show_svg()

这张图没太理解，从代码中的公式上看
图中y轴：胜率*平均收益-亏损概率*平均亏损 = 期望收益
但是随着stopvalue的上涨，期望收益不断靠近达到10？这一点不是很理解

del01

看不懂todo#

后面一部分看不懂了，暂时跳过吧，把图示截图出来

1
return_values = np.sort(total_return_by_type['Holding'].values)
2
idxs = np.ceil(np.linspace(0, len(return_values) - 1, 21)).astype(int)
3
bins = return_values[idxs][:-1]
4

5
def bin_return(total_return_by_type):
6
    classes = pd.cut(total_return_by_type['Holding'], bins=bins, right=True)
7
    new_level = pd.Index(np.array(classes.apply(lambda x: x.right)), name='bin_right')
8
    return total_return_by_type.vbt.stack_index(new_level, axis=0)
9

10
binned_total_return_by_type = bin_return(total_return_by_type)
11

12
expectancy_by_bin = get_expectancy(binned_total_return_by_type, 'bin_right')
13

14
expectancy_by_bin.vbt.plot(
15
    trace_kwargs=dict(mode='lines'),
16
    xaxis_title='Total return of holding',
17
    xaxis_tickformat='%',
18
    yaxis_title='Expectancy'
19
).show_svg()

del01

交互式图表

1
range_starts = pd.DatetimeIndex(list(map(lambda x: x[0], split_indexes)))
2
range_ends = pd.DatetimeIndex(list(map(lambda x: x[-1], split_indexes)))
3

4
symbol_lvl = total_return_by_type.index.get_level_values('symbol')
5
split_idx_lvl = total_return_by_type.index.get_level_values('split_idx')
6
range_start_lvl = range_starts[split_idx_lvl]
7
range_end_lvl = range_ends[split_idx_lvl]
8

9
asset_multi_select = ipywidgets.SelectMultiple(
10
    options=symbols,
11
    value=symbols,
12
    rows=len(symbols),
13
    description='Symbols'
14
)
15
dates = np.unique(yfdata.wrapper.index)
16
date_range_slider = ipywidgets.SelectionRangeSlider(
17
    options=dates,
18
    index=(0, len(dates)-1),
19
    orientation='horizontal',
20
    readout=False,
21
    continuous_update=False
22
)
23
range_start_label = ipywidgets.Label()
24
range_end_label = ipywidgets.Label()
25
metric_dropdown = ipywidgets.Dropdown(
26
    options=['Mean', 'Median', 'Win Rate', 'Expectancy'],
27
    value='Expectancy'
28
)
29
stop_scatter = vbt.plotting.Scatter(
30
    trace_names=exit_types,
31
    x_labels=stops,
32
    xaxis_title='Stop value',
33
    yaxis_title='Expectancy'
34
)
35
stop_scatter_img = ipywidgets.Image(
36
    format='png',
37
    width=stop_scatter.fig.layout.width,
38
    height=stop_scatter.fig.layout.height
39
)
40
bin_scatter = vbt.plotting.Scatter(
41
    trace_names=exit_types,
42
    x_labels=expectancy_by_bin.index,
43
    trace_kwargs=dict(mode='lines'),
44
    xaxis_title='Total return of holding',
45
    xaxis_tickformat='%',
46
    yaxis_title='Expectancy'
47
)
48
bin_scatter_img = ipywidgets.Image(
49
    format='png',
50
    width=bin_scatter.fig.layout.width,
51
    height=bin_scatter.fig.layout.height
52
)
53

54
def update_scatter(*args, **kwargs):
55
    _symbols = asset_multi_select.value
56
    _from = date_range_slider.value[0]
57
    _to = date_range_slider.value[1]
58
    _metric_name = metric_dropdown.value
59

60
    range_mask = (range_start_lvl >= _from) & (range_end_lvl <= _to)
61
    asset_mask = symbol_lvl.isin(_symbols)
62
    filtered = total_return_by_type[range_mask & asset_mask]
63

64
    filtered_binned = bin_return(filtered)
65
    if _metric_name == 'Mean':
66
        filtered_metric = filtered.groupby('stop_value').mean()
67
        filtered_bin_metric = filtered_binned.groupby('bin_right').mean()
68
    elif _metric_name == 'Median':
69
        filtered_metric = filtered.groupby('stop_value').median()
70
        filtered_bin_metric = filtered_binned.groupby('bin_right').median()
71
    elif _metric_name == 'Win Rate':
72
        filtered_metric = (filtered > 0).groupby('stop_value').mean()
73
        filtered_bin_metric = (filtered_binned > 0).groupby('bin_right').mean()
74
    elif _metric_name == 'Expectancy':
75
        filtered_metric = get_expectancy(filtered, 'stop_value')
76
        filtered_bin_metric = get_expectancy(filtered_binned, 'bin_right')
77

78
    stop_scatter.fig.update_layout(yaxis_title=_metric_name)
79
    stop_scatter.update(filtered_metric)
80
    stop_scatter_img.value = stop_scatter.fig.to_image(format="png")
81

82
    bin_scatter.fig.update_layout(yaxis_title=_metric_name)
83
    bin_scatter.update(filtered_bin_metric)
84
    bin_scatter_img.value = bin_scatter.fig.to_image(format="png")
85

86
    range_start_label.value = np.datetime_as_string(_from.to_datetime64(), unit='D')
87
    range_end_label.value = np.datetime_as_string(_to.to_datetime64(), unit='D')
88

89
asset_multi_select.observe(update_scatter, names='value')
90
date_range_slider.observe(update_scatter, names='value')
91
metric_dropdown.observe(update_scatter, names='value')
92
update_scatter()
93

94

95
dashboard = ipywidgets.VBox([
96
    asset_multi_select,
97
    ipywidgets.HBox([
98
        range_start_label,
99
        date_range_slider,
100
        range_end_label
101
    ]),
102
    metric_dropdown,
103
    stop_scatter_img,
104
    bin_scatter_img
105
])
106
dashboard

del01

1
dashboard.close()

黄金矿工

OHLCSTX.run生成各类退出信号#

不同方式的退出信号达成率#

merge期末强制退出信号#

持有到期hold_exits,随机退出rand_exits#

退出信号融合到columns.multiIndex#

各退出方式,退出价对应持仓周期#

各退出类型对应的收益率#

各退出方式收益率分位图#

各退出方式胜率#

不同止损方式在不同止损价位上的预期收益(期望收益)#

看不懂todo#