187 lines
6.1 KiB
YAML
187 lines
6.1 KiB
YAML
feature_engineering_methods_parameters:
|
||
|
||
LabelEncoder:
|
||
parameters: {}
|
||
|
||
KBinsDiscretizer:
|
||
parameters:
|
||
n_bins:
|
||
description: "指定每个特征要分成的箱数。可以是单个整数,表示所有特征使用相同的箱数;也可以是形状为 (n_features,) 的数组,为每个特征指定不同的箱数。"
|
||
default: 5
|
||
encode:
|
||
description: "指定离散化后输出的编码方式。可选值包括 'onehot'(独热编码)、'onehot-dense'(密集独热编码)、'ordinal'(序数编码)。"
|
||
default: 'onehot'
|
||
strategy:
|
||
description: "定义分箱策略。可选值包括 'uniform'(均匀分箱)、'quantile'(分位数分箱)、'kmeans'(K-Means 聚类分箱)。"
|
||
default: 'quantile'
|
||
|
||
FunctionTransformer:
|
||
parameters:
|
||
func:
|
||
description: "要应用于输入数据的函数。"
|
||
default: null
|
||
inverse_func:
|
||
description: "func 的逆函数,如果存在。"
|
||
default: null
|
||
validate:
|
||
description: "布尔值,指示是否在转换前验证输入数据。"
|
||
default: false
|
||
accept_sparse:
|
||
description: "布尔值,指示是否接受稀疏矩阵作为输入。"
|
||
default: false
|
||
check_inverse:
|
||
description: "布尔值,指示在适合期间是否检查 func 和 inverse_func 是否互为逆函数。"
|
||
default: true
|
||
kw_args:
|
||
description: "传递给 func 的其他关键字参数。"
|
||
default: null
|
||
inv_kw_args:
|
||
description: "传递给 inverse_func 的其他关键字参数。"
|
||
default: null
|
||
|
||
PowerTransformer:
|
||
parameters:
|
||
method:
|
||
description: "指定变换方法。可选值包括 'yeo-johnson' 和 'box-cox'。"
|
||
default: 'yeo-johnson'
|
||
standardize:
|
||
description: "布尔值,指示是否在变换后将数据标准化为零均值和单位方差。"
|
||
default: true
|
||
copy:
|
||
description: "布尔值,指示是否复制输入数据,或在原地进行变换。"
|
||
default: true
|
||
|
||
QuantileTransformer:
|
||
parameters:
|
||
n_quantiles:
|
||
description: "用于分位数变换的分位数数量。"
|
||
default: 1000
|
||
output_distribution:
|
||
description: "指定输出分布。可选值包括 'uniform' 和 'normal'。"
|
||
default: 'uniform'
|
||
ignore_implicit_zeros:
|
||
description: "布尔值,指示是否忽略隐式零。"
|
||
default: false
|
||
subsample:
|
||
description: "用于计算分位数的子样本大小。"
|
||
default: 1e5
|
||
random_state:
|
||
description: "用于随机数生成的种子。"
|
||
default: null
|
||
copy:
|
||
description: "布尔值,指示是否复制输入数据,或在原地进行变换。"
|
||
default: true
|
||
|
||
FeatureHasher:
|
||
parameters:
|
||
n_features:
|
||
description: "哈希空间的维度。"
|
||
default: 1048576
|
||
input_type:
|
||
description: "输入数据的类型。可选值包括 'dict' 和 'pair'。"
|
||
default: 'dict'
|
||
dtype:
|
||
description: "输出数据的类型。"
|
||
default: 'float64'
|
||
alternate_sign:
|
||
description: "布尔值,指示是否在哈希时使用交替符号。"
|
||
default: true
|
||
|
||
DictVectorizer:
|
||
parameters:
|
||
dtype:
|
||
description: "输出数据的类型。"
|
||
default: 'float64'
|
||
separator:
|
||
description: "用于分隔特征名称的分隔符。"
|
||
default: '='
|
||
sparse:
|
||
description: "布尔值,指示是否返回稀疏矩阵。"
|
||
default: true
|
||
sort:
|
||
description: "布尔值,指示是否对特征名称排序。"
|
||
default: true
|
||
|
||
PCA:
|
||
parameters:
|
||
n_components:
|
||
description: "要保留的主成分数量。可以是整数、浮点数或 'mle'。"
|
||
default: null
|
||
copy:
|
||
description: "布尔值,指示是否复制输入数据,或在原地进行变换。"
|
||
default: true
|
||
whiten:
|
||
description: "布尔值,指示是否对主成分进行白化。"
|
||
default: false
|
||
svd_solver:
|
||
description: "用于计算 SVD 的方法。可选值包括 'auto'、'full'、'arpack' 和 'randomized'。"
|
||
default: 'auto'
|
||
tol:
|
||
description: "奇异值分解的容差。"
|
||
default: 0.0
|
||
iterated_power:
|
||
description: "用于随机化 SVD 的迭代次数。"
|
||
default: 'auto'
|
||
random_state:
|
||
description: "用于随机数生成的种子。"
|
||
default: null
|
||
|
||
SelectKBest:
|
||
parameters:
|
||
score_func:
|
||
description: "用于计算特征得分的函数。"
|
||
default: 'f_classif'
|
||
k:
|
||
description: "要选择的特征数量。"
|
||
default: 10
|
||
|
||
RFE:
|
||
parameters:
|
||
estimator:
|
||
description: "用于特征选择的基模型。"
|
||
default: null
|
||
n_features_to_select:
|
||
description: "要选择的特征数量。"
|
||
default: null
|
||
step:
|
||
description: "每次迭代要移除的特征数量。"
|
||
default: 1
|
||
verbose:
|
||
description: "控制冗长模式的整数。"
|
||
default: 0
|
||
|
||
PolynomialFeatures:
|
||
parameters:
|
||
degree:
|
||
description: "生成多项式特征的最高次数。"
|
||
default: 2
|
||
interaction_only:
|
||
description: "布尔值,指示是否仅包含交互项。"
|
||
default: false
|
||
include_bias:
|
||
description: "布尔值,指示是否包含偏置列。"
|
||
default: true
|
||
order:
|
||
description: "输出特征的顺序。可选值包括 'C' 和 'F'。"
|
||
default: 'C'
|
||
|
||
OneHotEncoder:
|
||
parameters:
|
||
categories:
|
||
description: "指定每个特征的类别。"
|
||
default: 'auto'
|
||
drop:
|
||
description: "指定要从每个特征中删除的类别。"
|
||
default: null
|
||
sparse:
|
||
description: "布尔值,指示是否返回稀疏矩阵。"
|
||
default: true
|
||
dtype:
|
||
description: "输出数据的类型。"
|
||
default: 'float64'
|
||
handle_unknown:
|
||
description: "指定如何处理未知类别。可选值"
|
||
|
||
|
||
|