打分偏差的统计分析

news2026/5/4 10:07:06
原文towardsdatascience.com/statistical-analysis-on-scoring-bias-7b429d681bf5?sourcecollection_archive---------12-----------------------#2024-10-012024 年阿根廷探戈世界锦标赛https://databeast.medium.com/?sourcepost_page---byline--7b429d681bf5--------------------------------https://towardsdatascience.com/?sourcepost_page---byline--7b429d681bf5-------------------------------- 亚历山大·巴里加·发表于Towards Data Science ·阅读时间19 分钟·2024 年 10 月 1 日–https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c26da45d9628ea8bbe33109c6b264b62.png2024 年 Tango de Pista 世界舞蹈大赛冠军法蒂玛·卡拉科奇与布雷诺·马尔凯斯。图像来源TangoBA简而言之评审小组之间偏差的比例检验具有统计显著性。数据可视化显示了高度偏斜的分布对评审员和评审小组之间相对均值偏差的测试表明评审小组 1 存在负偏差给出较低的分数而评审小组 2 存在正偏差给出较高的分数。对各评审小组之间的均值偏差测试未能提供统计显著的差异证据但测试的统计功效较低。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/de27d64f95a7f8108700cf4ebf5f0dd9.png图像来源TangoBATango de Mundial是每年在阿根廷布宜诺斯艾利斯举办的阿根廷探戈比赛。来自世界各地的舞者汇聚布宜诺斯艾利斯争夺世界冠军的头衔。在 2024 年约有 500 对舞蹈搭档1000 名舞者参加了预选赛。仅有一小部分舞者晋级半决赛最终约 40 对舞者进入决赛。仅仅晋级 2024 年的决赛你就已经超过了全球 95%的竞争者。许多决赛选手利用这个平台推动自己的职业生涯而世界冠军的头衔则将你的面孔永载探戈历史几乎可以保证你作为职业舞者工作直到你不再需要为此奋斗。因此对于许多舞者来说他们的命运掌握在评审们对其舞蹈的评价之中。在本文中我们将对两个由 10 名评委组成的评审小组的评分偏差进行多项统计分析。每位评委都有自己对“什么是探戈”这一问题的回答。每位评委对评判标准的质量有不同的看法技巧、音乐性、拥抱、舞蹈词汇、舞台表现即你看起来像不像舞者等。正如你已经察觉到的这些评估高度主观因此毫不奇怪评委之间会产生很大的偏差。注意除非明确说明否则所有数据可视化即图表、图形、数据框截图均为作者原创作品。代码你可以在我的GitHub 个人主页找到所有用于本次分析的代码。[## my_portfolio/Argentine_Tango_Mundial at main · Alexander-Barriga/my_portfolio在这里你可以找到我参与的一些个人数据科学项目。 - my_portfolio/Argentine_Tango_Mundial at main ·…github.com数据限制在我们深入分析之前让我们先讨论一下数据的限制。你可以直接访问这份 PDF 文件查看初赛的得分。[## Ranking-Clasificatoria-Tango-de-Pista-Mundial-de-tango-2024.pdf编辑描述drive.google.com https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5e21d3b6e127b1bf7016876bdd74a94c.png来自初赛轮次的舞者得分第 1 页。每一行代表一个舞蹈双人组。注意每对舞者的评分来自 20 位评委中的 10 位。更多信息请见数据分析部分。数据截图由作者提供。评委并不代表整个世界。虽然舞蹈选手在某种程度上能代表全球探戈舞蹈人群但评委并不能——他们全都是阿根廷人。这使得一些人质疑比赛的合法性。至少这样的情况使得“Munidal de Tango”这一名称被认为是错误的。将舞者评分精确到小数点后 100 位是荒谬的。一些评委会将舞者评分精确到小数点后 100 位即 7.75 与 7.7。这引发了一个问题“是什么样的舞蹈质量会导致 0.05 的分差”至少这凸显了评分的高度主观性。显然这并不是一个使用高度可靠和精密测量设备的实验室物理实验。腐败与政治。在舞蹈社区中并不是什么秘密如果你参加了评审团成员的课程你很可能会从他们那里获得积极的偏见无论是有意的还是无意的因为你代表了他们的思想体系这使得他们在你的成功中有既得利益并且代表了一种利益冲突。仅提供舞者分数。不幸的是除了舞者的名字和分数外节日组织者并没有发布其他数据如经验年数、年龄或原籍国这大大限制了更全面的分析。艺术是高度主观的。在探戈中有许多不同的思想流派就像舞者有不同的意见一样。每个舞者都有自己的探戈哲学定义了什么是好的技巧或者什么样的拥抱感觉是美好的。专业知识。我们讨论的不是电影或美食评论。舞者需要经过多年的高度专注的训练才能培养出自己对阿根廷探戈的品味和有见地的意见。对于外行人来说难以将数据映射到舞者在舞台上的表现。尽管数据存在这些问题Tango Munidal 的数据仍然是我们可以获得的最大、最具代表性的全球阿根廷探戈舞者数据集。相信我——我的资历除了是数据科学家外我还是一名竞技阿根廷探戈舞者。虽然我没有参加 2024 年 Tango Munidal 比赛但我已经多年来在这项舞蹈上进行了刻苦训练除了其他舞蹈和武术。我是一个舞者一个武术家一个表演者也是探戈的守护者。虽然我的观点仅代表了阿根廷探戈中的一个主观声音但它是一个真实且有见地的声音。舞蹈评分中的偏差统计分析接下来我们将进行几项统计测试以评估评分偏差是否存在以及在哪些地方存在偏差。分析的概要如下各评审团之间的比例偏差测试数据可视化与比较评审在不同均值偏差中的表现测试评审间的相对平均偏差测试评审团之间的均值偏差1. 偏差的比例测试再次看看数据表第 1 页中表现最好的舞蹈情侣https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5e21d3b6e127b1bf7016876bdd74a94c.png数据表的第 1 页。由作者提供的数据截图。从左到右阅读表示评审名字的列名在Jimena Hoffner和Noelia Barsel之间你会看到第 1 至第 5 位以及第 11 至第 15 位的评审属于我们将称之为评审团 1的组别。第 6 至第 10 位以及第 16 至第 20 位的评审属于我们将称之为评审团 2的组别。注意到了什么吗注意到由第二评审小组评审的舞者比例明显更大而由第一评审小组评审的舞者比例较小。如果你浏览PDF的数据表你会看到这种比例差异在所有晋级到半决赛的选手中都得到了验证。备注绿色阴影部分的舞者晋级到了半决赛而没有被绿色阴影标出的舞者则没有晋级。这就引出了一个问题这种比例差异是真实的吗还是由于随机抽样即舞者被随机分配到一个小组而不是另一个小组嗯我们有一个统计检验可以用来回答这个问题。双尾检验检验两个总体比例是否相等我们将使用双尾 z 检验来测试两个比例是否在任一方向上存在显著差异。我们关心的是一个比例是否显著不同于另一个比例无论它是更大还是更小。统计检验假设随机抽样样本必须从各自的总体中独立且随机地抽取。大样本量样本量必须足够大以便样本比例差异的抽样分布可以近似为正态分布。这一近似来自于中心极限定理。预期的成功与失败次数为了确保正态近似成立每个组中预期的成功和失败次数应该至少为 5。我们的数据集满足所有这些假设。进行检验定义我们的假设原假设每个分布的比例相同。备择假设每个分布的比例不相同。2. 选择统计显著性水平alpha 的默认值为 0.055%。我们没有理由放宽这个值例如 10%或使其更加严格例如 1%。所以我们将使用默认值。Alpha 表示我们因随机抽样而错误拒绝原假设支持备择假设的容忍度即第一类错误。接下来我们将使用下面提供的 Python 代码来进行检验。defplot_two_tailed_test(z_value):# Generate a range of x valuesxnp.linspace(-4,4,1000)# Get the standard normal distribution values for these x valuesystats.norm.pdf(x)# Create the plotplt.figure(figsize(10,6))plt.plot(x,y,labelStandard Normal Distribution,colorblack)# Shade the areas in both tails with redplt.fill_between(x,y,where(xz_value),colorred,alpha0.5,labelRight Tail Area)plt.fill_between(x,y,where(x-z_value),colorred,alpha0.5,labelLeft Tail Area)# Define critical values for alpha 0.05alpha0.05critical_valuestats.norm.ppf(1-alpha/2)# Add vertical dashed blue lines for critical valuesplt.axvline(critical_value,colorblue,linestyledashed,linewidth1,labelfCritical Value:{critical_value:.2f})plt.axvline(-critical_value,colorblue,linestyledashed,linewidth1,labelfCritical Value:{-critical_value:.2f})# Mark the z-valueplt.axvline(z_value,colorred,linestyledashed,linewidth1,labelfZ-Value:{z_value:.2f})# Add labels and titleplt.title(Two-Tailed Z-Test Visualization)plt.xlabel(Z-Score)plt.ylabel(Probability Density)plt.legend()plt.grid(True)# Show plotplt.savefig(f../images/p-value_location_in_z_dist_z_test_proportionality.png)plt.show()deftwo_proportion_z_test(successes1,total1,successes2,total2): Perform a two-proportion z-test to check if two population proportions are significantly different. Parameters: - successes1: Number of successes in the first sample - total1: Total number of observations in the first sample - successes2: Number of successes in the second sample - total2: Total number of observations in the second sample Returns: - z_value: The z-statistic - p_value: The p-value of the test # Calculate sample proportionsp1successes1/total1 p2successes2/total2# Combined proportionp_combined(successes1successes2)/(total1total2)# Standard errorsenp.sqrt(p_combined*(1-p_combined)*(1/total11/total2))# Z-valuez_value(p1-p2)/se# P-value for two-tailed testp_value2*(1-stats.norm.cdf(np.abs(z_value)))returnz_value,p_value min_score_for_semi_finals7.040is_semi_finalistdf.PROMEDIOmin_score_for_semi_finals# Number of couples scored by panel 1 advancing to semi-finalssuccesses_1df[is_semi_finalist][panel_1].dropna(axis0).shape[0]# Number of couples scored by panel 2 advancing to semi-finalssuccesses_2df[is_semi_finalist][panel_2].dropna(axis0).shape[0]# Total number of couples that where scored by panel 1n1df[panel_1].dropna(axis0).shape[0]# Total sample of couples that where scored by panel 2n2df[panel_2].dropna(axis0).shape[0]# Perform the testz_value,p_valuetwo_proportion_z_test(successes_1,n1,successes_2,n2)# Print the resultsprint(fZ-Value:{z_value:.4f})print(fP-Value:{p_value:.4f})# Check significance at alpha 0.05alpha0.05ifp_valuealpha:print(The difference between the two proportions is statistically significant.)else:print(The difference between the two proportions is not statistically significant.)# Generate the plot# P-Value: 0.0000plot_two_tailed_test(z_value)https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/4f585500591fbce3fd26128ea56ce705.pngZ 值是我们计算得到的统计值。请注意它远远超出了标准正态分布的范围。图表显示计算得到的 Z 值远远超出了我们在原假设为真的情况下期望看到的 z 值范围。因此p 值为 0.0表明我们必须拒绝原假设支持备择假设。这意味着比例差异是真实的而不是由于随机抽样造成的。17%的舞蹈组合在第一评审小组的评审下晋级到半决赛42%的舞蹈组合在第二评审小组的评审下晋级到半决赛我们的第一个偏差统计测试提供了证据表明在由第二组评委评判的舞者的评分中存在正向偏差几乎是 2 倍的提升。接下来我们将深入分析每位评委的评分分布并看看他们各自的偏差如何影响整个小组的评分偏差。2. 数据可视化本节中我们将分析每位评委的个人评分分布和偏差。以下 20 个直方图展示了每位评委给舞者打的分数。请记住每位舞者都由第 1 组或第 2 组的所有 10 位评委评分。评委的直方图是随机排列的即第一列并不代表第 1 组的评委。注意评委评分的范围是 1 到 10 分。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/47516465471d5d1102f184992973efdf.png来自所有 20 位评委的评分分布。标题包含评委的姓名。注意有些评委的评分比其他评委严格得多。这引出了以下问题评委之间的偏差分布是什么样的换句话说哪些评委评分更严厉哪些评分更宽松评委的评分偏差是否会被他们组内其他评委抵消如果没有评委之间的平均分数是否存在统计差异我们将在第三部分回答第 1 个问题。我们将在第四部分回答第 2 个问题。正如我们在上面的直方图中看到的评委 Martin Ojeda 是最严厉的舞蹈评委。让我们看看他的 QQ 图。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/e8aa1769f3178c79a88296b3c1718bc0.pngMartin 给出的评分分布。左下偏差x 轴小于-2在下分位区最左侧数据点实际上偏离了红线以上。这表明对于最弱的表演评分比预期的高。Martin 可能是出于同情稍微提高了对舞蹈组合的评分。一个潜在的原因可能是Martín 希望避免对表现最差的选手打出极低的分数从而给出稍微高一些的分数。Martín 略微高估了较弱的竞争者这可能表明他对那些本来应该得低分的表演有轻微的正向偏差。评分差异的稀释如果较弱的表演被高估这可能会压缩评分范围使较弱和中等水平的竞争者之间的差距变小。这可能会使强、适中和弱的表演之间的差异不那么明显。例如如果一场弱的表演得到一个较高的分数比如 5.5 或 6.0而不是 4.0 或 4.5而中等水平的表演得分为 6.5那么弱者和中等竞争者之间的差距就被人为缩小了。这破坏了竞争的公平性因为这些分数不再真实反映表演质量。低分和高分之间的平衡尽管马丁高估较弱的表演者但注意到在中间分数段6.0–7.0得分紧密跟随正态分布表现出更中立的行为。然而这种情况被他在高分段的慷慨评分对顶级表演者的正偏见所抵消表明马丁倾向于“拉高”表现光谱的两端。总的来说这种高估最弱和最强竞争者的组合会压缩中间的得分。中等水平的竞争者可能会因此受到最大的不利影响因为他们被夹在被高估的较弱表现和被慷慨评分的较强表现之间。在下一节中我们将识别出马丁认为最佳舞蹈搭档的极端得分并在与评审小组中其他评委的得分对比时为这对舞蹈搭档的得分提供更多背景。在 Jupyter Notebook 中还有 19 个其他的 QQ 图我们在本文中不会一一介绍因为这会让文章变得冗长不堪。不过您可以自行查看。3. 测试评委间相对均值偏差在本节中我们将回答上一节提出的第一个问题。本节将分析各个评委的评分偏差。下一节将关注评审小组之间的评分偏差。评委之间的偏差分布是怎样的换句话说哪些评委评分更严苛哪些评委评分更宽松我们将进行迭代 T 检验以检查某位评委的平均分是否在统计学上与其他 19 位评委的平均分的均值不同也就是说计算其他 19 位评委的平均分的均值。# Calculate mean and standard deviation of the distribution of mean scoresdistribution_meannp.mean(judge_means)distribution_stdnp.std(judge_means,ddof1)# Function to perform T-testdeft_test(score,mean,std_dev,n):Perform a T-test to check if a score is significantly different from the mean.t_value(score-mean)/(std_dev/np.sqrt(n))# Degrees of freedom for the T-testdfn-1# Two-tailed testp_value2*(1-stats.t.cdf(np.abs(t_value),df))returnt_value,p_value# Number of samples in the distributionnlen(judge_means)# Dictionary to store the test resultsresults{}# Iterate through each judges mean score and perform T-testforjudge,scoreinzip(judge_features,judge_means):t_value,p_valuet_test(score,distribution_mean,distribution_std,n)# Store results in the dictionaryresults[judge]{mean_score:score,T-Value:t_value,P-Value:p_value,Significant:p_value0.05}# Convert results to DataFrame and processdf_judge_means_testpd.DataFrame(results).T df_judge_means_test.mean_scoredf_judge_means_test.mean_score.astype(float)df_judge_means_test.sort_values(mean_score)https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/37d54a43bf08ebd52f3aaa28e45724b9.png按评委的平均分值排序的 T 检验结果。这里有 20 位评委他们的平均分、t 统计量、p 值以及每位评委的平均分与其他 19 位评委的平均分分布的差异是否在统计学上显著。我们有三组评委那些评分非常严格统计学上低于平均水平那些通常给出平均分统计学上在平均范围内以及那些评分较为宽松统计学上高于平均水平。让我们关注三位具有代表性的评委马丁·奥赫达、法昆多·多拉·克鲁兹和诺埃利亚·巴尔西。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9a976baac461786bdc2df4bfe8f0f4ae.png这三位评委代表了所有 20 位评委中的最严格、典型和宽松的评分偏差倾向。请注意马丁·奥赫达的得分分布和均值蓝线相比于所有评审的平均得分均值红线偏向较低的值。但我们也看到他的分布大致呈正态分布除了少数几个离群值。我们稍后会回到得分为 7.5 的那对舞伴。几乎任何由马丁评分的舞蹈组合都会看到他们的总平均分受到影响。法昆多·德·拉·克鲁兹的得分分布大致呈正态分布且方差较大。他是相对于其他同行而言偏差最小的评审。几乎任何由法昆多评分的舞蹈组合都可以期待一个接近所有评审得分的结果因此他们不必担心负面偏差但也不太可能获得高分从而提高他们的总体平均分。诺埃利亚·巴里斯代表的是那种相比其他评审倾向于给更多舞者一个有利评分的评审。所有舞蹈组合都应该希望诺埃利亚被分配到他们的评审小组。现在让我们回到马丁的离群值舞伴。在马丁看来卢卡斯·卡塔赫纳和卢西拉·迪亚兹·科洛德雷罗的舞蹈表现就像离群值一样。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0ce5e44dd755f626f8ad4ec40f491f55.png卢卡斯·卡塔赫纳和卢西拉·迪亚兹·科洛德雷罗。PROMEDIO 意味着平均值。马丁·奥赫达给了这对舞蹈组合第四高的得分7.600而他的得分高于 7.326 的平均得分PROMEDIO虽然马丁·奥赫达的得分在与他自己分布的比较中是一个离群值但它并不像这对舞蹈组合收到的其他得分那样高。这意味着两件事马丁·奥赫达是一个整体保守的评分者正如我们在上一节所见当与其他评审的得分相比时马丁·奥赫达的离群得分实际上是有意义的这表明这对舞蹈组合确实表现突出这里他们演绎的是一种名为米隆加的探戈子类别这种舞蹈通常与其他类别的音乐如探戈和华尔兹有很大的不同通常不包括旋转动作而是包括小而快速的步伐强调音乐性。我可以告诉你他们在这段视频中的表现非常出色我想大多数舞者都会同意这个评价。享受表演。4. 测试评审小组之间均值偏差在本节中我们通过回答以下问题来测试评审组 1 和评审组 2 之间的偏差评审的评分偏差是否会被他们小组内其他评审的评分所抵消如果没有评审均值之间是否存在统计学差异我们将通过两种方式测试评审偏差排名基础的评审偏差两尾 T 检验比较评审组 1 和评审组 2 的得分分布排名基础的评审偏差在这里我们将对评审的均分进行排名和标准化并计算每个评审小组的偏差。这是我们衡量评审小组之间潜在偏差的一种方法。panel_1judge_features[:5]judge_features[10:15]panel_2judge_features[5:10]judge_features[15:]df_judge_meansdf_judge_means_test.sort_values(mean_score).mean_score# Calculate ranksranksdf_judge_means.rank()# Calculate mean and std of ranksmeans_ranksranks.mean()stds_ranksranks.std()# Standardize ranksdf_judge_ranks(ranks-means_ranks)/stds_ranks df_judge_ranks# these are the same judges sorted in the same way as before based on their mean scores# except here we have converted mean values into rankings and standardized the rankings# Now we want to see how these 20 judges are distributed between the two panels# do the biases for each judge get canceled out by their peers on the same panel?https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/26c07a50052d77a1871f5105aa4ab75f.png所有 20 位评审的排序排名我们将每个评委的平均分值替换为相对于同行的排名。马丁仍然是最严苛、偏见最负面的评委。诺埃利亚仍然是偏见最正面的评委。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/ef3fe75545b6a8dc69cd6146f85a316f.png面板 1https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/a70db127fa5f07377319d5ef7de77423.png面板 2请注意面板 1 中的大多数评委偏向负面只有 4 位评委偏向正面。面板 2 中的大多数评委偏向正面只有 2 位评委偏向负面法昆多则大致中立。如果面板内部的偏差相互抵消那么个别评委的偏见实际上不再重要任何舞蹈搭档都会被公平评分。但是如果面板内部的偏差没有抵消那么可能会存在不公平的优势。面板 1 的平均排名值-0.39478面板 2 的平均排名值0.39478我们发现平均面板排名表明面板内部的偏差并未相互抵消并提供了证据表明舞蹈搭档在面板 2 评审下有优势。面板 1 和面板 2 分布之间的双尾 T 检验。接下来我们继续对面板偏差进行进一步的检验。下方图表展示了两个分布。蓝色表示分配给面板 1 的评委给出的平均分布橙色表示分配给面板 2 的评委给出的平均分布。在图表中你会看到每个面板的平均分。面板 1 的平均分为 6.62面板 2 的平均分为 6.86。尽管 0.24 的面板平均差异看起来较小但请注意晋级半决赛的差异仅由 0.013 的差异决定。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/d98db464822a16027a91e78f88906971.png两个面板评委的平均分布。在进行两样本 T 检验后我们发现面板平均分之间的差异在统计上并不显著。该检验未能提供额外证据表明面板 1 和面板 2 之间的偏差存在统计差异。该检验的 P 值为 0.0808与我们默认的 0.05 的显著性水平相差不大。大数法则我们知道来自大数法则的结论表明在小样本分布中两个面板各有 10 个数据点我们通常会发现方差大于其对应总体分布的方差。然而随着样本数的增加样本分布的参数将趋近于总体分布的参数即均值和方差。这可能是 T 检验未能提供面板偏差不同的证据的原因即由于方差较大。统计功效另一种理解我们所看到结果的方式是通过统计效能。统计效能指的是测试正确拒绝虚假零假设的概率。统计效能受到几个因素的影响。样本大小效应量你想要检测的真实差异或关系显著性水平例如α0.05数据的变异性标准差增加我们测试统计效能最可靠的方法是收集更多的数据点然而在这里这是不可行的。结论本文我们将探讨 2024 年在布宜诺斯艾利斯举行的世界探戈锦标赛初赛数据。我们通过四种方式分析了评委和评审团的评分偏差测试评审团之间的比例偏差数据可视化测试评委之间的相对均值偏差测试评审团之间的均值偏差偏差证据我们发现被评审团 2 的评委评分的舞者晋级半决赛的比例显著更高。个别评委的评分分布差异很大有些偏高有些偏低。我们看到马丁·奥赫达对表现最差和最好的一对舞伴有明显的正偏向他通过“拉高”他们的得分并压缩中等水平的舞者得分。总体来看他的评分分布远低于其他所有评委。有些评委给出了更典型的分数而有些评委则给出了非常宽松的分数与同行相比。评审团之间的相对均值偏差存在明显差异。评审团 1 的大多数评委被认为在评分上存在负偏向而评审团 2 的大多数评委则存在正偏向。因此评审团 1 在评分舞者时表现出总体的负偏向而评审团 2 则表现出总体的正偏向。没有偏差证据发现评审团 1 和评审团 2 之间的均值差异在统计学上没有显著性。由于分布的样本量较小导致统计效能较低。因此这个测试不如其他测试可靠。我的结论是个别评委和评审团层面上都有足够的偏差证据。分配到评审团 2 的舞者确实拥有一定的竞争优势。因此对于寻求在比赛中获得额外优势的潜在竞争舞者我们有一些建议。如何赢得舞蹈比赛存在非权谋主义和权谋主义两种方式可以增加你获胜的机会。本文的结果和经验背景知识为权谋主义方法提供了更多的信服依据。非权谋主义训练。永远没有什么能替代你投入 10000 小时的练习以获得精通的过程。权谋主义上课并与那些你知道会出现在你评审小组中的教练建立关系。你的成功意味着该评审员舞蹈风格的验证和他们业务的推广。如果你的资源有限可以专注于那些评分严格的评审以帮助提高你的平均分。如果有多个评审小组找到一种方法确保你被分配到那个对你更有利的评审小组从而提高你晋级下一轮的机会。最终想法我个人认为尽管在舞蹈比赛中玩弄权力游戏有一定的实用性但这其实很愚蠢。没有什么能替代天赋尤其是那种原始且无可辩驳的天赋。这篇分析最终是一个有趣的激情项目也是一个应用一些统计概念的机会而这个话题我非常珍惜。关于作者亚历山大·巴里加是一位数据科学家和竞技阿根廷探戈舞者。他目前住在加利福尼亚州洛杉矶。如果你已经看到这里考虑给出反馈分享他的文章或者直接与他联系提供工作机会——他正在积极寻找下一个数据科学职位https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/79770e4c79cdaf716551ffc4f0adc802.png图片来自作者。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2577774.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…