A
ankush_jn2000
Guest
Hi all,
Es esmu strādā pie BF533 procesoru un vēlaties, lai optimizētu šādu kodu, izmantojot iezīmes Blackfin procesoru.Man ir kvadrātveida bināru matricu izmēru mxm.Es gribu Ex-vai teikt rindu x ar rindu y, ka matrica un uzglabāt rezultāts atkal rinda x.DAG reģistrēties I1 un I3 ir norāda uz rindas x un y attiecīgi.Ir daudzas stendos šajā kodā.Kā es varu noņemt iekrišanas un optimizētu šo nepilnīgs?I pārbauda profilu, ka tas nepilnīgs patērē lielāko daļu izpildes laiks un cauruļvadu skatītājs ir arī rāda stendos šo kodu.Jebkura cilpa unrolling vai citu metodi, ja iespējams?
P1 = m2; / / m2, ir vārdu skaita (32 bitu) pēc kārtas.m2 vienmēr būs vairākas 4
LSETUP (Loop4_Beg, Loop4_End) LC1 = P1;
Loop4_Beg:
mnop | | R4 = [I1] | | R5 = [I3 ];
R4 = R4 ^ R5;
Loop4_End: [I1 ] = R4;
Thanks daudz par izdevumu jūsu dārgo laiku.
Es ceru saņemt risinājums tam.
Sveicieni,
Ankush
Es esmu strādā pie BF533 procesoru un vēlaties, lai optimizētu šādu kodu, izmantojot iezīmes Blackfin procesoru.Man ir kvadrātveida bināru matricu izmēru mxm.Es gribu Ex-vai teikt rindu x ar rindu y, ka matrica un uzglabāt rezultāts atkal rinda x.DAG reģistrēties I1 un I3 ir norāda uz rindas x un y attiecīgi.Ir daudzas stendos šajā kodā.Kā es varu noņemt iekrišanas un optimizētu šo nepilnīgs?I pārbauda profilu, ka tas nepilnīgs patērē lielāko daļu izpildes laiks un cauruļvadu skatītājs ir arī rāda stendos šo kodu.Jebkura cilpa unrolling vai citu metodi, ja iespējams?
P1 = m2; / / m2, ir vārdu skaita (32 bitu) pēc kārtas.m2 vienmēr būs vairākas 4
LSETUP (Loop4_Beg, Loop4_End) LC1 = P1;
Loop4_Beg:
mnop | | R4 = [I1] | | R5 = [I3 ];
R4 = R4 ^ R5;
Loop4_End: [I1 ] = R4;
Thanks daudz par izdevumu jūsu dārgo laiku.
Es ceru saņemt risinājums tam.
Sveicieni,
Ankush