Problemă în lista HTML -Getting tabelul din anunț HTML format converti într CSV folosind Python

voturi
0

Alerg codul pentru a obține un tabel HTML folosind Python și îl transformă în CSV..The rula cod corect, dar formatarea nu este bun. table_rows = [] pentru rândul în rows_data: CURRENT_ROW = [] row_data = row.findAll ( 'td', {}) pentru idx, datele din (row_data) enumera: dacă idx = 0 și idx = 4: current_row.append (data.text [: - 1]) altfel: current_row.append (data.text) table_rows.append (CURRENT_ROW)

Print (Len (CURRENT_ROW))

Print (CURRENT_ROW)

Print (table_rows) de
imprimare ( de tip (table_rows))

De ieșire este ca: [[ 'Nu codename \ n', 'versiunea veche, nu mai este acceptată: 1.0', '23 septembrie 2008', '1', '[2] \ n'], [ Petit Four (numai utilizată intern) \ n ' 'versiunea veche, nu mai este acceptată: 1.1', '09 februarie 2009', '2', '[2] \ n'], [ 'Cupcake \ n',' versiunea veche, nu mai este acceptată: 1.5' , '27 aprilie 2009', '3', '\ n'], [ 'gogoașă \ n', 'versiunea veche, nu mai este acceptată: 1.6', '15 septembrie 2009', „4 ' '[3] \ n'], [ 'Eclair \ n', 'versiunea veche, nu mai este acceptată: 2.0-2.1', '26 octombrie 2009', '5 - 7',' [4] \ n '], [' Froyo \ n ' 'versiunea veche, nu mai este acceptată: 2.2 - 2.2.3', '20 mai 2010', '8', '[5] \ n'], [' Turtă dulce \ n ' 'versiunea veche, nu mai este acceptată: 2.3 - 2.3.7', '06 decembrie 2010', '9 - 10', '[6] \ n'], [ 'Honeycomb \ n',' versiunea veche, nu mai este acceptat: 3.0 - 3.2.6' , '22 februarie 2011', '11 - 13' , '[7] \ n'], [ 'Ice Cream Sandwich \ n', „versiunea veche, nu mai este acceptată: 4.0 - 4.0.4' , '18 octombrie 2011', '14 - 15' , '[8] \ n'], [ 'Jelly Bean \ n', „versiunea veche, nu mai este acceptată: 4.1 4.3.1' , '09 iulie 2012', '16 - 18' , '[9] \ n'], [ 'KitKat \ n', 'versiunea veche, nu mai este acceptată: 4.4 - 4.4.4', ' 31 octombrie 2013' , '19 - 20' , '[10] \ n'], [ 'Lollipop \ n', 'versiunea veche, nu mai este acceptată: 5.0 - 5.1.1', '12 noiembrie 2014', '21 - 22' , '[11] \ n'], [ 'Marshmallow \ n', 'versiunea veche, nu mai este acceptată: 6.0 - 6.0.1', '05 octombrie 2015', '23', „[ 12] \ n '], [' Nuga \ n“, 'versiune mai veche, dar încă susținută: 7.0 - 7.1.2', '22 august 2016', '24 - 25' , '[13] \ n'] , [ 'Oreo \ n', 'versiune mai veche, dar încă acceptată: 8.0-8.1', 'douăzeci și unu august 2017', '26 - 27' , '[14] \ n'], [ 'Pie \ n', 'versiune mai veche, dar încă susținută: 9.0', '06 august 2018', '28', '[15] \ n'], [ 'Android 10 \ n', 'versiunea curentă stabilă: 10,0', „03 septembrie , 2019' , '29', '[16] \ n'], [ 'Legenda: versiunea veche versionOlder, încă supportedLatest versionLatest previzualizare versionFuture eliberare \ n']

Cum de a elimina \ n din lista ???

Întrebat 24/10/2019 la 12:55
sursa de către utilizator
În alte limbi...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more