How to run Narayan and Popp (2010) unit root test with two structural break

Question

Dear friends,

I have the NP (2010) coding. I wish to run the unit root test using my data in .txt file. Based on coding, it mention that ** the first column should contain the years or quarters (i.e. 1973.3) ** and the second the observations.

My question is, do I need to have the variable name for the column or should i remove it from the .txt file? Im using quarterly data which consist of 68 observation so I use the following command in the coding:

load yy[68,2]=C:\Users\\hafizah\Desktop\hp.txt;

However, the result of my test indicates that the optimal lag is 0 and I got the same for other variables. However, when I remove the year column from the .txt file and run the command, the optimal lag has become 4 and 5. But according to the author in the coding file, the first column should be the year. I've tried for other data too. When I put the year, the optimal lag become 0 and only give other than value 0 when I remove the year column. Hope somebody could help me regarding this issue.

The hp.txt contain the following data

199901 12.15932752
199902 12.1605188
199903 12.16127285
199904 12.1601588
200001 12.17354945
200002 12.20002635
200003 12.22209771
200004 12.24953292
200101 12.25672023
200102 12.27340002
200103 12.29917945
200104 12.32090395
200201 12.27644336
200202 12.29779613
200203 12.3310463
200204 12.352683
200301 12.37000409
200302 12.39040593
200303 12.42399994
200304 12.44148696
200401 12.45892101
200402 12.48462339
200403 12.51449253
200404 12.53540877
200501 12.55809654
200502 12.57862165
200503 12.60764954
200504 12.63255579
200601 12.7249825
200602 12.73698159
200603 12.75354772
200604 12.76147293
200701 12.76360338
200702 12.78515899
200703 12.8450623
200704 12.82605194
200801 12.8367878
200802 12.8463801
200803 12.83849496
200804 12.88811052
200901 12.91527613
200902 12.94327846
200903 12.96138698
200904 12.99125873
201001 13.02146312
201002 13.05275595
201003 13.07740982
201004 13.10662703
201101 13.12621119
201102 13.15433397
201103 13.17839227
201104 13.20854463
201201 13.22737758
201202 13.27411048
201203 13.29385635
201204 13.31621997
201301 13.33573626
201302 13.35976042
201303 13.37956007
201304 13.39272866
201401 13.40379237
201402 13.42350852
201403 13.43862087
201404 13.4529913
201501 13.48186547
201502 13.48289551
201503 13.48817395
201504 13.49770179

2. The original Narayan and Popp (2010) coding are as follows:

NEW;

FORMAT /M1 /ROS 8,4;

LIBRARY pgraph;

_pdate="";

_pcolor = 1;

_pmcolor = ZEROS(8,1)|15;

 

/*

path1 = "Z:\\Stephan.Popp\\Projekte\\perronmultiple\\gauss\\output.out";

 

OUTPUT FILE = ^path1 ON;

*/

 

"******************************************";

"date: " datestr(date) "  time:  " timestr(time);

"*******************************************";

 

/*           DATA

**  the first column should contain the years or quarters (i.e. 1973.3)

**  and the second the observations

*/

 

load yy[68,2]=C:\Users\\hafizah\Desktop\lrhd.txt;           @ change path settings and yy[here include # of observations ,2]@

 

/* Randomly chosen dataset

yy=SEQA(1900,1,100)~RNDN(100,1);

*/

 

XY(yy[.,1],yy[.,2]);

 

yyy= yy[.,2];

kmax = 5;                             @ max lag                                           @

ttt = rows(yyy);

tau = 0.2;                             @ trimming factor           @

 

"Series: Log(.)";

"Sample:" yy[1,1]~yy[rows(yyy),1];

"# observations:" ttt;

"maximum lag " kmax;

"trimming factor " tau;

 

"program: popp2break.prg" ;

"*******************************";

tbunter = MAXC(3+kmax|CEIL(tau*ttt));             @ lower break date @

"break date floor, effective tau " tbunter~yy[tbunter,1]~tbunter/ttt;

tbober  = MINC(ttt-3-kmax|FLOOR((1-tau)*ttt));    @ upper break date @

"break date ceiling, effective (1-tau) " tbober~yy[tbober,1]~tbober/ttt;

"*******************************************";

 

/************** Model 0 *****************/

 

ergeb = ZEROS(2,1);     @ Vektor zum Speichern der Ergebnisse @

tbopt = ZEROS(2,1);

 

ttb1 = tbunter;

ttb2 = 0;

DO WHILE ttb1 <= tbober; @ Schleife der durchlaufenden Bruchzeitpunkte T_B @

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break0b(yyy,ttb1,ttb2,kmax);

 

IF ABS(ttheta1) > ABS(ergeb[1,1]);

ergeb[1,1] = ttheta1;

ergeb[2,1] = ttb1;

ENDIF;

 

ttb1 = ttb1 + 1;

ENDO;

 

tbopt[1] = ergeb[2,1];

 

ergeb = ZEROS(2,1);     @ Vektor zum Speichern der Ergebnisse @

 

ttb2 = tbunter;

DO WHILE ttb2 <= tbober;

IF ABS(ttb2 - tbopt[1]) < 2; ttb2 = tbopt[1] + 2; ENDIF;

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break0b(yyy,tbopt[1],ttb2,kmax);

 

IF ABS(ttheta1) > ABS(ergeb[1,1]);

ergeb[1,1] = ttheta1;

ergeb[2,1] = ttb2;

ENDIF;

 

ttb2 = ttb2 + 1;

ENDO;

 

tbopt[2] = ergeb[2,1];

tbopt = SORTC(tbopt,1);

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break0b(yyy,tbopt[1],tbopt[2],kmax);

 

"****************";

"output";

"****************";

"model type M0";

"first break  " tbopt[1]~yy[tbopt[1],1]~tbopt[1]/ROWS(yy);

"second break " tbopt[2]~yy[tbopt[2],1]~tbopt[2]/ROWS(yy);

"phi = rho-1  " rho1;

"t value      " trho1;

"optimal lag  " kk1;

"variance     " varres1;

"------";

"coeff tstat  ";

"yyverz constant du1verz du2verz dtb1 dtb2";

pp1~tstat1;

 

 

/************** Model 1 *****************/

 

ergeb = ZEROS(2,1);     @ Vektor zum Speichern der Ergebnisse @

tbopt = ZEROS(2,1);

 

ttb1 = tbunter;

ttb2 = 0;

DO WHILE ttb1 <= tbober; @ Schleife der durchlaufenden Bruchzeitpunkte T_B @

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break1b(yyy,ttb1,ttb2,kmax);

 

IF ABS(ttheta1) > ABS(ergeb[1,1]);

ergeb[1,1] = ttheta1;

ergeb[2,1] = ttb1;

ENDIF;

 

ttb1 = ttb1 + 1;

ENDO;

 

tbopt[1] = ergeb[2,1];

 

ergeb = ZEROS(2,1);     @ Vektor zum Speichern der Ergebnisse @

 

ttb2 = tbunter;

DO WHILE ttb2 <= tbober;

IF ABS(ttb2 - tbopt[1]) < 2; ttb2 = tbopt[1] + 2; ENDIF;

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break1b(yyy,tbopt[1],ttb2,kmax);

 

IF ABS(ttheta1) > ABS(ergeb[1,1]);

ergeb[1,1] = ttheta1;

ergeb[2,1] = ttb2;

ENDIF;

 

ttb2 = ttb2 + 1;

ENDO;

 

tbopt[2] = ergeb[2,1];

tbopt = SORTC(tbopt,1);

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break1b(yyy,tbopt[1],tbopt[2],kmax);

 

"output";

"****************";

"model type M1";

"first break  " tbopt[1]~yy[tbopt[1],1]~tbopt[1]/ROWS(yy);

"second break " tbopt[2]~yy[tbopt[2],1]~tbopt[2]/ROWS(yy);

"phi = rho-1  " rho1;

"t value      " trho1;

"optimal lag  " kk1;

"variance     " varres1;

"------";

"coeff tstat  ";

"yyverz constant du1verz du2verz dtb1 dtb2 time";

pp1~tstat1;

 

 

/************** Model 2 *****************/

 

ergeb = ZEROS(2,1);     @ Vektor zum Speichern der Ergebnisse @

tbopt = ZEROS(2,1);

 

ttb1 = tbunter;

ttb2 = 0;

DO WHILE ttb1 <= tbober; @ Schleife der durchlaufenden Bruchzeitpunkte T_B @

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break2b(yyy,ttb1,ttb2,kmax);

 

IF ABS(ttheta1) > ABS(ergeb[1,1]);

ergeb[1,1] = ttheta1;

ergeb[2,1] = ttb1;

ENDIF;

 

ttb1 = ttb1 + 1;

ENDO;

 

tbopt[1] = ergeb[2,1];

 

ergeb = ZEROS(2,1);     @ Vektor zum Speichern der Ergebnisse @

 

ttb2 = tbunter;

DO WHILE ttb2 <= tbober;

IF ABS(ttb2 - tbopt[1]) < 2; ttb2 = tbopt[1] + 2; ENDIF;

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break2b(yyy,tbopt[1],ttb2,kmax);

 

IF ABS(ttheta1) > ABS(ergeb[1,1]);

ergeb[1,1] = ttheta1;

ergeb[2,1] = ttb2;

ENDIF;

 

ttb2 = ttb2 + 1;

ENDO;

 

tbopt[2] = ergeb[2,1];

tbopt = SORTC(tbopt,1);

 

{rho1,trho1,ttheta1,pp1,rres1,varres1,tstat1,kk1} = mio2break2b(yyy,tbopt[1],tbopt[2],kmax);

 

"output";

"****************";

"model type M2";

"first break  " tbopt[1]~yy[tbopt[1],1]~tbopt[1]/ROWS(yy);

"second break " tbopt[2]~yy[tbopt[2],1]~tbopt[2]/ROWS(yy);

"phi = rho-1  " rho1;

"t value      " trho1;

"optimal lag  " kk1;

"variance     " varres1;

"------";

"coeff tstat  ";

"yylagged constant du1lagged du2lagged dtb1 dtb2 dt1verz dt2verz time";

pp1~tstat1;

 

OUTPUT OFF;

 

END;

 

PROC(8)=mio2break0b(yy,ttb1,ttb2,kkmax);

LOCAL t,mu,du1,du1verz,du2,du2verz,dtb1,dtb2,yyverz,dyy,x1,x,pp,rres;

LOCAL varres,varpp,tstat,kk,ampel,xx,ttheta;

 

t=ROWS(yy);

mu=ONES(t,1);              @ Absolutglied @

du1=ZEROS(t,1);             @ Dummy @

du1[ttb1+1:t,1]=ONES(t-ttb1,1);

du1verz=lagn(du1,1);                                     @ Dummy verz�gert DU_t-1 @

dtb1=ZEROS(t,1);            @ Impulsdummy @

dtb1[ttb1+1:ttb1+1,1]=1;

yyverz=lagn(yy,1);

dyy=yy-yyverz;

 

IF ttb2 == 0;

x1=yyverz~mu~du1verz~dtb1;

ELSE;

du2=ZEROS(t,1);             @ Dummy @

du2[ttb2+1:t,1]=ONES(t-ttb2,1);

du2verz=lagn(du2,1);                                  @ Dummy verz�gert DU_t-1 @

dtb2=ZEROS(t,1);            @ Impulsdummy @

dtb2[ttb2+1:ttb2+1,1]=1;

 

x1=yyverz~mu~du1verz~du2verz~dtb1~dtb2;

ENDIF;

 

IF kkmax == 0;

 

x = TRIMR(x1,1,0);

dyy = TRIMR(dyy,1,0);

pp = INV(x'x)*x'dyy;                                                                                                                                      @ Sch�tzvektor p @

rres = dyy - x*pp;                                                                                                                                                           @ Residuenvektor @

varres =(rres'*rres)/(ROWS(x)-COLS(x));                 @ Sch�tzung der Residualvarianz @

varpp = DIAG(rres'rres*INV(x'x)/(ROWS(x)-COLS(x)));     @ Sch�tzung der Varianz-Kovarianzmatrix @

tstat = pp./SQRT(varpp);                                  @ t-Statistiken der Parametersch�tzungen @

kk = 0;

ELSE;

 

x = TRIMR(x1~SHIFTR(dyy',SEQA(1,1,kkmax),0)',kkmax+1,0);

dyy = TRIMR(dyy,kkmax+1,0);

 

kk = kkmax;

ampel = 0;

 

DO WHILE kk >= 0 AND ampel == 0;

xx = x[.,1:COLS(x1)+kk];

 

pp = INV(xx'xx)*xx'dyy;                                                                                                                                             @ Sch�tzvektor p @

rres = dyy - xx*pp;                                                                                                                                                      @ Residuenvektor @

varres =(rres'*rres)/(ROWS(xx)-COLS(xx));                 @ Sch�tzung der Residualvarianz @

varpp = DIAG(rres'rres*INV(xx'xx)/(ROWS(xx)-COLS(xx)));          @ Sch�tzung der Varianz-Kovarianzmatrix @

tstat = pp./SQRT(varpp);                                  @ t-Statistiken der Parametersch�tzungen @

IF ABS(tstat[COLS(x1)+kk]) > 1.96; ampel = 1; ENDIF;   @ Signifkanzniveau 10%: 1.96 @

kk = kk-1;

ENDO;

kk = kk+1;

 

ENDIF;

 

IF ttb2 == 0;

ttheta = tstat[4];

ELSE;

ttheta = tstat[6];

ENDIF;

 

RETP(pp[1],tstat[1],ttheta,pp,rres,varres,tstat,kk);

 

ENDP;

 

PROC(8)=mio2break1b(yy,ttb1,ttb2,kkmax);

LOCAL t,mu,zeit,du1,du1verz,du2,du2verz,dtb1,dtb2,yyverz,dyy,x1,x,pp,rres;

LOCAL varres,varpp,tstat,kk,ampel,xx,ttheta;

 

t=ROWS(yy);

mu=ONES(t,1);              @ Absolutglied @

zeit=SEQA(1,1,t);          @ Zeittrend @

du1=ZEROS(t,1);             @ Dummy @

du1[ttb1+1:t,1]=ONES(t-ttb1,1);

du1verz=lagn(du1,1);                                     @ Dummy verz�gert DU_t-1 @

dtb1=ZEROS(t,1);            @ Impulsdummy @

dtb1[ttb1+1:ttb1+1,1]=1;

yyverz=lagn(yy,1);

dyy=yy-yyverz;

 

IF ttb2 == 0;

x1=yyverz~mu~du1verz~dtb1~zeit;

ELSE;

du2=ZEROS(t,1);             @ Dummy @

du2[ttb2+1:t,1]=ONES(t-ttb2,1);

du2verz=lagn(du2,1);                                  @ Dummy verz�gert DU_t-1 @

dtb2=ZEROS(t,1);            @ Impulsdummy @

dtb2[ttb2+1:ttb2+1,1]=1;

 

x1=yyverz~mu~du1verz~du2verz~dtb1~dtb2~zeit;

ENDIF;

 

IF kkmax == 0;

 

x = TRIMR(x1,1,0);

dyy = TRIMR(dyy,1,0);

pp = INV(x'x)*x'dyy;                                                                                                                                      @ Sch�tzvektor p @

rres = dyy - x*pp;                                                                                                                                                           @ Residuenvektor @

varres =(rres'*rres)/(ROWS(x)-COLS(x));                 @ Sch�tzung der Residualvarianz @

varpp = DIAG(rres'rres*INV(x'x)/(ROWS(x)-COLS(x)));     @ Sch�tzung der Varianz-Kovarianzmatrix @

tstat = pp./SQRT(varpp);                                  @ t-Statistiken der Parametersch�tzungen @

kk = 0;

ELSE;

 

x = TRIMR(x1~SHIFTR(dyy',SEQA(1,1,kkmax),0)',kkmax+1,0);

dyy = TRIMR(dyy,kkmax+1,0);

 

kk = kkmax;

ampel = 0;

 

DO WHILE kk >= 0 AND ampel == 0;

xx = x[.,1:COLS(x1)+kk];

 

pp = INV(xx'xx)*xx'dyy;                                                                                                                                             @ Sch�tzvektor p @

rres = dyy - xx*pp;                                                                                                                                                      @ Residuenvektor @

varres =(rres'*rres)/(ROWS(xx)-COLS(xx));                 @ Sch�tzung der Residualvarianz @

varpp = DIAG(rres'rres*INV(xx'xx)/(ROWS(xx)-COLS(xx)));          @ Sch�tzung der Varianz-Kovarianzmatrix @

tstat = pp./SQRT(varpp);                                  @ t-Statistiken der Parametersch�tzungen @

IF ABS(tstat[COLS(x1)+kk]) > 1.96; ampel = 1; ENDIF;   @ Signifkanzniveau 10%: 1.96 @

kk = kk-1;

ENDO;

kk = kk+1;

 

ENDIF;

 

IF ttb2 == 0;

ttheta = tstat[4];

ELSE;

ttheta = tstat[6];

ENDIF;

 

RETP(pp[1],tstat[1],ttheta,pp,rres,varres,tstat,kk);

 

ENDP;

 

PROC(8)=mio2break2b(yy,ttb1,ttb2,kkmax);

LOCAL t,mu,zeit,du1,du1verz,du2,du2verz,dtb1,dtb2,dt1,dt1verz,dt2,dt2verz,yyverz,dyy,x1,x,pp,rres;

LOCAL varres,varpp,tstat,kk,ampel,xx,ttheta;

 

t=ROWS(yy);

mu=ONES(t,1);              @ Absolutglied @

zeit=SEQA(1,1,t);          @ Zeittrend @

du1=ZEROS(t,1);             @ Dummy @

du1[ttb1+1:t,1]=ONES(t-ttb1,1);

du1verz=lagn(du1,1);                                     @ Dummy verz�gert DU_t-1 @

dtb1=ZEROS(t,1);            @ Impulsdummy @

dtb1[ttb1+1:ttb1+1,1]=1;

dt1 = ZEROS(t,1);

dt1[ttb1+1:t,1] = SEQA(1,1,(t-ttb1));

dt1verz=lagn(dt1,1);

yyverz=lagn(yy,1);

dyy=yy-yyverz;

 

IF ttb2 == 0;

x1=yyverz~mu~du1verz~dtb1~dt1verz~zeit;

ELSE;

du2=ZEROS(t,1);             @ Dummy @

du2[ttb2+1:t,1]=ONES(t-ttb2,1);

du2verz=lagn(du2,1);                                  @ Dummy verz�gert DU_t-1 @

dtb2=ZEROS(t,1);            @ Impulsdummy @

dtb2[ttb2+1:ttb2+1,1]=1;

dt2 = ZEROS(t,1);

dt2[ttb2+1:t,1] = SEQA(1,1,(t-ttb2));

dt2verz=lagn(dt2,1);

 

x1=yyverz~mu~du1verz~du2verz~dtb1~dtb2~dt1verz~dt2verz~zeit;

ENDIF;

 

IF kkmax == 0;

 

x = TRIMR(x1,1,0);

dyy = TRIMR(dyy,1,0);

pp = INV(x'x)*x'dyy;                                                                                                                                      @ Sch�tzvektor p @

rres = dyy - x*pp;                                                                                                                                                           @ Residuenvektor @

varres =(rres'*rres)/(ROWS(x)-COLS(x));                 @ Sch�tzung der Residualvarianz @

varpp = DIAG(rres'rres*INV(x'x)/(ROWS(x)-COLS(x)));     @ Sch�tzung der Varianz-Kovarianzmatrix @

tstat = pp./SQRT(varpp);                                  @ t-Statistiken der Parametersch�tzungen @

kk = 0;

ELSE;

 

x = TRIMR(x1~SHIFTR(dyy',SEQA(1,1,kkmax),0)',kkmax+1,0);

dyy = TRIMR(dyy,kkmax+1,0);

 

kk = kkmax;

ampel = 0;

 

DO WHILE kk >= 0 AND ampel == 0;

xx = x[.,1:COLS(x1)+kk];

 

pp = INV(xx'xx)*xx'dyy;                                                                                                                                             @ Sch�tzvektor p @

rres = dyy - xx*pp;                                                                                                                                                      @ Residuenvektor @

varres =(rres'*rres)/(ROWS(xx)-COLS(xx));                 @ Sch�tzung der Residualvarianz @

varpp = DIAG(rres'rres*INV(xx'xx)/(ROWS(xx)-COLS(xx)));          @ Sch�tzung der Varianz-Kovarianzmatrix @

tstat = pp./SQRT(varpp);                                  @ t-Statistiken der Parametersch�tzungen @

IF ABS(tstat[COLS(x1)+kk]) > 1.96; ampel = 1; ENDIF;   @ Signifkanzniveau 10%: 1.96 @

kk = kk-1;

ENDO;

kk = kk+1;

 

ENDIF;

 

IF ttb2 == 0;

ttheta = tstat[4];

ELSE;

ttheta = tstat[6];

ENDIF;

 

RETP(pp[1],tstat[1],ttheta,pp,rres,varres,tstat,kk);

 

ENDP;

 

proc diff(x,k) ;

if ( k == 0) ;

retp(x) ;

endif ;

retp(trimr(x,k,0)-trimr(lagn(x,k),k,0)) ;

endp ;

 

proc lagn(x,n);

local y;

y = shiftr(x', n, (miss(0, 0))');

retp(y');

endp;

9 Answers

Your Answer

aptech · Answer 1

This code assumes that there is not a variable name in the file. The first thing it does is load in EVERY line from the file:

load yy[68,2]=C:\Users\\hafizah\Desktop\hp.txt;           @ change path settings and yy[here include # of observations ,2]@

If the first row of the file contains variable name headers, then the yy matrix will have the variable names in the numeric elements of yy[1:2,1]. The next thing that the program does is to graph all elements that were read in of the time series, with this command:

XY(yy[.,1],yy[.,2]);

The variable names would cause problems if you tried to graph them. So, if this graph looks like what you expect to see from your data, then you are probably inputing the data correctly.

I will see if I have some time to look more into this later.

How to run Narayan and Popp (2010) unit root test with two structural break

9 Answers

Your Answer

9 Answers

You must login to post answers.

Have a Specific Question?

Need Support?