Comment trouver la moyenne d'un ensemble de colonnes dans une rangée d'une trame de données de pyspark et l'ajouter comme une autre colonne à la même trame de données?

voix
0

J'ai un dataframe composé de 500 colonnes sur lesquelles, pour chaque ligne que je dois obtenir la moyenne ensemble de colonnes commençant par country_.

expr=[F.sum(train_data_df[x])/colCount for x in train_data_df.columns if 'country_' in x]
avg_train_data_df = train_data_df.withColumn('avg', *expr)

Je reçois la réponse d'erreur suivant:

TypeError: withColumn() takes 3 positional arguments but 212 were given

Créé 19/09/2018 à 13:23
source utilisateur
Dans d'autres langues...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more