MLPlatform/date_feature/parameter.yaml

187 lines
6.1 KiB
YAML
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

feature_engineering_methods_parameters:
LabelEncoder:
parameters: {}
KBinsDiscretizer:
parameters:
n_bins:
description: "指定每个特征要分成的箱数。可以是单个整数,表示所有特征使用相同的箱数;也可以是形状为 (n_features,) 的数组,为每个特征指定不同的箱数。"
default: 5
encode:
description: "指定离散化后输出的编码方式。可选值包括 'onehot'(独热编码)、'onehot-dense'(密集独热编码)、'ordinal'(序数编码)。"
default: 'onehot'
strategy:
description: "定义分箱策略。可选值包括 'uniform'(均匀分箱)、'quantile'(分位数分箱)、'kmeans'K-Means 聚类分箱)。"
default: 'quantile'
FunctionTransformer:
parameters:
func:
description: "要应用于输入数据的函数。"
default: null
inverse_func:
description: "func 的逆函数,如果存在。"
default: null
validate:
description: "布尔值,指示是否在转换前验证输入数据。"
default: false
accept_sparse:
description: "布尔值,指示是否接受稀疏矩阵作为输入。"
default: false
check_inverse:
description: "布尔值,指示在适合期间是否检查 func 和 inverse_func 是否互为逆函数。"
default: true
kw_args:
description: "传递给 func 的其他关键字参数。"
default: null
inv_kw_args:
description: "传递给 inverse_func 的其他关键字参数。"
default: null
PowerTransformer:
parameters:
method:
description: "指定变换方法。可选值包括 'yeo-johnson' 和 'box-cox'。"
default: 'yeo-johnson'
standardize:
description: "布尔值,指示是否在变换后将数据标准化为零均值和单位方差。"
default: true
copy:
description: "布尔值,指示是否复制输入数据,或在原地进行变换。"
default: true
QuantileTransformer:
parameters:
n_quantiles:
description: "用于分位数变换的分位数数量。"
default: 1000
output_distribution:
description: "指定输出分布。可选值包括 'uniform' 和 'normal'。"
default: 'uniform'
ignore_implicit_zeros:
description: "布尔值,指示是否忽略隐式零。"
default: false
subsample:
description: "用于计算分位数的子样本大小。"
default: 1e5
random_state:
description: "用于随机数生成的种子。"
default: null
copy:
description: "布尔值,指示是否复制输入数据,或在原地进行变换。"
default: true
FeatureHasher:
parameters:
n_features:
description: "哈希空间的维度。"
default: 1048576
input_type:
description: "输入数据的类型。可选值包括 'dict' 和 'pair'。"
default: 'dict'
dtype:
description: "输出数据的类型。"
default: 'float64'
alternate_sign:
description: "布尔值,指示是否在哈希时使用交替符号。"
default: true
DictVectorizer:
parameters:
dtype:
description: "输出数据的类型。"
default: 'float64'
separator:
description: "用于分隔特征名称的分隔符。"
default: '='
sparse:
description: "布尔值,指示是否返回稀疏矩阵。"
default: true
sort:
description: "布尔值,指示是否对特征名称排序。"
default: true
PCA:
parameters:
n_components:
description: "要保留的主成分数量。可以是整数、浮点数或 'mle'。"
default: null
copy:
description: "布尔值,指示是否复制输入数据,或在原地进行变换。"
default: true
whiten:
description: "布尔值,指示是否对主成分进行白化。"
default: false
svd_solver:
description: "用于计算 SVD 的方法。可选值包括 'auto'、'full'、'arpack' 和 'randomized'。"
default: 'auto'
tol:
description: "奇异值分解的容差。"
default: 0.0
iterated_power:
description: "用于随机化 SVD 的迭代次数。"
default: 'auto'
random_state:
description: "用于随机数生成的种子。"
default: null
SelectKBest:
parameters:
score_func:
description: "用于计算特征得分的函数。"
default: 'f_classif'
k:
description: "要选择的特征数量。"
default: 10
RFE:
parameters:
estimator:
description: "用于特征选择的基模型。"
default: null
n_features_to_select:
description: "要选择的特征数量。"
default: null
step:
description: "每次迭代要移除的特征数量。"
default: 1
verbose:
description: "控制冗长模式的整数。"
default: 0
PolynomialFeatures:
parameters:
degree:
description: "生成多项式特征的最高次数。"
default: 2
interaction_only:
description: "布尔值,指示是否仅包含交互项。"
default: false
include_bias:
description: "布尔值,指示是否包含偏置列。"
default: true
order:
description: "输出特征的顺序。可选值包括 'C' 和 'F'。"
default: 'C'
OneHotEncoder:
parameters:
categories:
description: "指定每个特征的类别。"
default: 'auto'
drop:
description: "指定要从每个特征中删除的类别。"
default: null
sparse:
description: "布尔值,指示是否返回稀疏矩阵。"
default: true
dtype:
description: "输出数据的类型。"
default: 'float64'
handle_unknown:
description: "指定如何处理未知类别。可选值"