跳到内容

Lexicase 选择

此文件是 TPOT 库的一部分。

当前版本的 TPOT 由 Cedars-Sinai 的以下人员开发:- Pedro Henrique Ribeiro (https://github.com/perib, https://www.linkedin.com/in/pedro-ribeiro/) - Anil Saini (anil.saini@cshs.org) - Jose Hernandez (jgh9094@gmail.com) - Jay Moran (jay.moran@cshs.org) - Nicholas Matsumoto (nicholas.matsumoto@cshs.org) - Hyunjun Choi (hyunjun.choi@cshs.org) - Gabriel Ketron (gabriel.ketron@cshs.org) - Miguel E. Hernandez (miguel.e.hernandez@cshs.org) - Jason Moore (moorejh28@gmail.com)

原始版本的 TPOT 主要由宾夕法尼亚大学的以下人员开发:- Randal S. Olson (rso@randalolson.com) - Weixuan Fu (weixuanf@upenn.edu) - Daniel Angell (dpa34@drexel.edu) - Jason Moore (moorejh28@gmail.com) - 以及许多慷慨的开源贡献者

TPOT 是自由软件:您可以根据自由软件基金会发布的 GNU 宽通用公共许可证(LGPL)的条款,版本 3 或(由您选择)任何后续版本,重新分发和/或修改它。

分发 TPOT 是希望它有用,但 **没有任何担保**;甚至没有适销性或特定用途适用性的默示担保。详情请参阅 GNU 宽通用公共许可证。

您应该已经随 TPOT 收到了 GNU 宽通用公共许可证的副本。如果没有,请参见 https://gnu.ac.cn/licenses/

lexicase_selection(scores, k, n_parents=1, rng=None)

根据 Lexicase 选择,重复 *k* 次选择最佳个体。返回的列表包含所选 *个体* 的索引。

参数

名称 类型 描述 默认值
scores ndarray

得分矩阵,行表示个体,列表示不同目标上的得分。

必需
k int

要选择的个体数量。

必需
n_parents int

为每个个体选择的父代数量。默认为 1。

1
rng (int, Generator)

随机数生成器。默认为 None。

None

返回

类型 描述
一个包含所选个体索引的数组,形状为 (k, n_parents)。
源代码在 tpot/selectors/lexicase_selection.py
def lexicase_selection(scores, k, n_parents=1, rng=None):
    """
    Select the best individual according to Lexicase Selection, *k* times.
    The returned list contains the indices of the chosen *individuals*.

    Parameters
    ----------
    scores : np.ndarray
        The score matrix, where rows the individuals and the columns are the corresponds to scores on different objectives.
    k : int
        The number of individuals to select.
    n_parents : int, optional
        The number of parents to select per individual. The default is 1.
    rng : int, np.random.Generator, optional
        The random number generator. The default is None.
    Returns
    -------
        A array of indices of selected individuals of shape (k, n_parents).
    """
    rng = np.random.default_rng(rng)
    chosen =[]
    for i in range(k*n_parents):
        candidates = list(range(len(scores)))
        cases = list(range(len(scores[0])))
        rng.shuffle(cases)

        while len(cases) > 0 and len(candidates) > 1:
            best_val_for_case = max(scores[candidates,cases[0]])
            candidates = [x for x in candidates if scores[x, cases[0]] == best_val_for_case]
            cases.pop(0)
        chosen.append(rng.choice(candidates))

    return np.reshape(chosen, (k, n_parents))