log_prob Înțelegere pentru distribuția normală în pytorch

voturi
1

Eu sunt în prezent încearcă să rezolve Pendulul-v0 din mediul de gimnastică openAi care are un spațiu de acțiune continuă. Ca rezultat, am nevoie de a utiliza o distribuție normală pentru a gusta acțiunile mele. Ceea ce nu înțeleg este dimensiunea log_prob atunci când îl utilizați:

introduceți

Am fost de așteptat un tensor de mărime 2 (una pentru fiecare log_prob acțiuni), dar o ieșire tensor de mărime (2,2).

Cu toate acestea, atunci când se utilizează o distribuție categoriale pentru mediu discret log_prob are mărimea așteptată. De ce este log_prob pentru distribuția normală a unei dimensiuni diferite?

Întrebat 19/03/2020 la 21:23
sursa de către utilizator
În alte limbi...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more