Replicarea rezultatelor din pd.merge în SQL?

voturi
0

M-am jucat cu câteva seturi de date la nivel local în Python și acum încerc să reproduc aceleași rezultate într-un mediu cloud cu SQL.

Am 3 tabele, fiecare cu mai multe ID-uri duplicate. De exemplu, tabelul A va conține ID-uri a, b, c, d, ... , tabelul B va conține ID-uri a, c, e, a1, a2 ... , iar tabelul C va conține ID-uri d, f, a2, b1, b2, ...

Acum fac pd.merge pentru tabelul A și tabelul B pe ID a , și tabelul C cu tabelul rezultat din prima îmbinare pe ID a2 . La utilizarea pd.merge, am observat că va adăuga o _x sau a _y la ID-urile duplicate (prin asta, mă refer la primul pd.merge din tabelul A și tabelul B, c din tabelul A ar deveni c_x , și c din tabelul B ar deveni c_y și așa mai departe pentru orice alte ID-uri duplicate. Același lucru s-ar aplica pentru orice alt ID duplicat pentru orice aderare.

Cum aș putea să reproduc acest proces și să ocolesc problema cu ID-uri duplicate în SQL?

Întrebat 26/05/2020 la 03:30
sursa de către utilizator
În alte limbi...                            


1 răspunsuri

voturi
0

Cred că puteți redenumi în restul coloanelor unite cu nume noi:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Sper că este util.

Publicat 10/06/2020 la 15:51
sursa de către utilizator

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more