ANALISA MULTIPLE REGRESION DENGAN STATA 9.0

A.Analisis Univariat

Tabel 1.

sum

Variable | Obs Mean Std. Dev. Min Max

————-+——————————————————–

caseid | 654 327.5 188.9378 1 654

subjid | 654 37169.57 23690.86 201 90001

age | 654 9.931193 2.953935 3 19

fev | 654 2.63678 .8670591 .791 5.793

height | 654 61.14358 5.703513 46 74

————-+——————————————————–

sex | 654 .5137615 .5001931 0 1

smoke | 654 .0993884 .2994118 0 1

Pada hasil diatas,dapat dilihat deskripsi responden,yaitu :responden berjumlah 654 orang,rata-rata umur responden 9,93 tahun,standar deviasi 2,95 thn,umur termuda 3 tahun dan yang tertua umur 19 tahun.Dari variable height/tinggi,rata-rata tinggi responden 61,14 inci,standar deviasi 5,70 inci,yang paling rendah tingginya 46 inci dan paling tinggi 74 inci.Untuk variable outcome fev dapat kita lihat rata-rata kekuatan fev adalah 2,64 lt/det,standar deviasi 0,87 lt/det,fev yang paling rendah 0,791 lt/det dan yang paling tinggi 5,793 lt/det.Sedangkan untuk variable sex/jenis kelamin dan smoke/merokok datanya dalam bentuk katagorik.Sex dikategorikan menjadi 0 = perempuan dan 1 = laki-laki,sedangkan smoke,0 = tidak merokok dan 1 = merokok.Pada nilai observasi terlihat semua berjumlah 654,berarti tidak ada data yang missing.

B. Analisis dengan Stepwise Regression

Hasil dibawah ini(tabel 2 s/d tabel 5)adalah hasil analisa regresi dengan metode stepwise/pr(.1),dengan cara memasukkan satu persatu variable prediktornya.Kita mencoba lebih dulu memasukkan variable age.Setiap memasukkan variable selanjutnya kita melihat perubahan nilai beta 1,dalam hal ini yang menjadi beta 1 adalah nilai coefisien age pada tabel uji t.Apabila nilai beta 1( age ) berubah 20% atau lebih saat dimasukkan variable lain ke model,ini berarti ada asosiasi atau variable tersebut berpengaruh terhadap model regresi.

Tabel 2.

. sw,pr(.1):reg fev age

begin with full model

p < 0.1000 for all terms in model

Source | SS df MS Number of obs = 654

————-+—————————— F( 1, 652) = 872.18

Model | 280.919154 1 280.919154 Prob > F = 0.0000

Residual | 210.000679 652 .322086931 R-squared = 0.5722

————-+—————————— Adj R-squared = 0.5716

Total | 490.919833 653 .751791475 Root MSE = .56753

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

age | .222041 .0075185 29.53 0.000 .2072777 .2368043

_cons | .4316481 .0778954 5.54 0.000 .278692 .5846042

——————————————————————————

Tabel 3.

. sw,pr(.1):reg fev age height

begin with full model

p < 0.1000 for all terms in model

Source | SS df MS Number of obs = 654

————-+—————————— F( 2, 651) = 1067.96

Model | 376.244941 2 188.122471 Prob > F = 0.0000

Residual | 114.674892 651 .176151908 R-squared = 0.7664

————-+—————————— Adj R-squared = 0.7657

Total | 490.919833 653 .751791475 Root MSE = .4197

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

age | .0542807 .0091061 5.96 0.000 .0363998 .0721616

height | .1097118 .0047162 23.26 0.000 .100451 .1189726

_cons | -4.610466 .2242706 -20.56 0.000 -5.050847 -4.170085

——————————————————————————

Tabel 4.

. sw,pr(.1):reg fev age height sex

begin with full model

p < 0.1000 for all terms in model

Source | SS df MS Number of obs = 654

————-+—————————— F( 3, 650) = 744.63

Model | 380.271883 3 126.757294 Prob > F = 0.0000

Residual | 110.647951 650 .170227616 R-squared = 0.7746

————-+—————————— Adj R-squared = 0.7736

Total | 490.919833 653 .751791475 Root MSE = .41259

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

age | .0613638 .0090694 6.77 0.000 .043555 .0791726

height | .1045596 .0047557 21.99 0.000 .0952213 .113898

sex | .1611121 .033125 4.86 0.000 .0960672 .2261569

_cons | -4.44856 .222966 -19.95 0.000 -4.88638 -4.010739

——————————————————————————

Tabel 5.

. sw,pr(.1):reg fev age height sex smoke

begin with full model

p = 0.1414 >= 0.1000 removing smoke

Source | SS df MS Number of obs = 654

————-+—————————— F( 3, 650) = 744.63

Model | 380.271883 3 126.757294 Prob > F = 0.0000

Residual | 110.647951 650 .170227616 R-squared = 0.7746

————-+—————————— Adj R-squared = 0.7736

Total | 490.919833 653 .751791475 Root MSE = .41259

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

age | .0613638 .0090694 6.77 0.000 .043555 .0791726

height | .1045596 .0047557 21.99 0.000 .0952213 .113898

sex | .1611121 .033125 4.86 0.000 .0960672 .2261569

_cons | -4.44856 .222966 -19.95 0.000 -4.88638 -4.010739

Tabel 6

. sw,pr(.1):reg fev age smoke

begin with full model

p < 0.1000 for all terms in model

Source | SS df MS Number of obs = 654

————-+—————————— F( 2, 651) = 443.25

Model | 283.058247 2 141.529123 Prob > F = 0.0000

Residual | 207.861587 651 .319295832 R-squared = 0.5766

————-+—————————— Adj R-squared = 0.5753

Total | 490.919833 653 .751791475 Root MSE = .56506

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

age | .2306046 .0081844 28.18 0.000 .2145336 .2466755

smoke | -.2089949 .0807453 -2.59 0.010 -.3675476 -.0504421

_cons | .3673731 .0814357 4.51 0.000 .2074647 .5272814

——————————————————————————

Dengan melihat hasil-hasil tabel diatas dapat terlihat bahwa pada table 2 nilai coefisien age ( beta 1) adalah 0,222.Pada table 3 dimasukkan variable height nilai coefisien age berubah menjadi 0,054 dan juga nilai R squarenya berubah dari 0,572 (57,2%) menjadi 0,766 ( 76,6 % ).Masuknya variable height memberikan perubahan nilai coefisien age lebih dari 10%,dengan memperhatikan perubahan ini berarti variable height mempunyai pengaruh yang sangat signifikan terhadap model regresi atau fev.

Pada table 4,dimasukkan variable sex ke dalam model regresi.Pada table ini dapat kita lihat perubahan nilai coefisien age ( beta 1) dari 0,054 menjadi 0,061 dan nilai R square dari 0,776 ( 76,6% ) menjadi 0,774 ( 77,4% ).Perubahan nilai age melebihi 10%,ini berarti variable sex mempunyai pengaruh terhadap fev/model tersebut.

Selanjutnya dimasukkan variable smoke,hasilnya pada tabel 5 terlihat bahwa variable smoke dikeluarkan secara otomatis,dikarenakan nilai t test melebihi dari 0.1 dan nilai coefisien age tetap 0,061 ,berarti variable smoke tidak berpengaruh terhadap model regresi atau tidak memiliki asosiasi.

Hal yang sama dapat juga kita lihat pada table 6,dimana disini kita coba setelah dimasukkan variable age seperti table 2,lalu dimasukkan variable smoke.Hasilnya kita bandingkan antara table 2 dengan table 6.Ternyata nilai coefisien age ( beta 1 ) berubah tidak signifikan tidak berubah melebihi 10 %,yaitu dari 0,22 menjadi 0,23 dan nilai R square berubah dari 57,2% menjadi 57,6%.Ini juga membuktikan bahwa variable smoke tidak berpengaruh atau tidak memiliki asosiasi terhadap model atau fev.

Tabel 7

. sw,pr(.1):reg fev height age

begin with full model

p < 0.1000 for all terms in model

Source | SS df MS Number of obs = 654

————-+—————————— F( 2, 651) = 1067.96

Model | 376.244941 2 188.122471 Prob > F = 0.0000

Residual | 114.674892 651 .176151908 R-squared = 0.7664

————-+—————————— Adj R-squared = 0.7657

Total | 490.919833 653 .751791475 Root MSE = .4197

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

height | .1097118 .0047162 23.26 0.000 .100451 .1189726

age | .0542807 .0091061 5.96 0.000 .0363998 .0721616

_cons | -4.610466 .2242706 -20.56 0.000 -5.050847 -4.170085

——————————————————————————

Tabel 8

. sw,pr(.1):reg fev height age smoke

begin with full model

p < 0.1000 for all terms in model

Source | SS df MS Number of obs = 654

————-+—————————— F( 3, 650) = 715.69

Model | 376.837002 3 125.612334 Prob > F = 0.0000

Residual | 114.082831 650 .175512048 R-squared = 0.7676

————-+—————————— Adj R-squared = 0.7665

Total | 490.919833 653 .751791475 Root MSE = .41894

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

height | .1090947 .0047196 23.12 0.000 .0998272 .1183622

age | .059741 .0095634 6.25 0.000 .0409621 .07852

smoke | -.1102319 .0600175 -1.84 0.067 -.2280834 .0076196

_cons | -4.616007 .2238833 -20.62 0.000 -5.055629 -4.176385

——————————————————————————

Untuk membuktikan bahwa variable smoke tidak berpengaruh pada model,dapat kita lihat juga hasil analisis table 7 dan table 8.Pada table 7 pertama dimasukkan adalah variable height,nilai coefisien height(beta 1) adalah 0,109,selanjutnya pada table 8 dimasukkan variable smoke.Setelah dimasukkan variable smoke hasil analisis terlihat bahwa coefisien height berubah sangat sedikit,bahkan dianggap tidak berubah.Ini membuktikan bahwa variable smoke tidak berpengaruh terhadap fev dengan metode stepwise (pr 0.1).

. sw reg fev age height sex smoke,pr(.1)

begin with full model

p = 0.1414 >= 0.1000 removing smoke

Source | SS df MS Number of obs = 654

————-+—————————— F( 3, 650) = 744.63

Model | 380.271883 3 126.757294 Prob > F = 0.0000

Residual | 110.647951 650 .170227616 R-squared = 0.7746

————-+—————————— Adj R-squared = 0.7736

Total | 490.919833 653 .751791475 Root MSE = .41259

——————————————————————————

fev | Coef. Std. Err. t P>|t| [95% Conf. Interval]

————-+—————————————————————-

age | .0613638 .0090694 6.77 0.000 .043555 .0791726

height | .1045596 .0047557 21.99 0.000 .0952213 .113898

sex | .1611121 .033125 4.86 0.000 .0960672 .2261569

_cons | -4.44856 .222966 -19.95 0.000 -4.88638 -4.010739

——————————————————————————

Setelah dilakukan analisis dengan metode stepwise regression/ sw,pr (.1),hasil analisis dapat kita simpulkan bahwa variable smoke dikeluarkan dari model regresi dikarenakan nilai t test < 0,1. Pada nilai t test menunjukkan semua variable yang masuk kedalam model regresi.Jadi variable prediktor yang masuk kedalam model regresi adalah :age,height dan sex.

Tabel ANOVA digunakan untuk menguji persamaan regresi atau model,pada hasil diatas Nilai F test menunjukkan nilai 0.0001 dengan degrees of freedom 3 dan 650 ,ini berarti pada nilai alpha 0.05 variabel age,height dan sex secara signifikan dapat memprediksi variable fev,atau secara statistic Ho ( Ho= pada regresi ditolak karena nilai F<= 0.05.(beta variabel-variabel prediktor tidak sama dengan nol).Kesimpulan ada hubungan linier antara fev dengan age,height dan sex.

Nilai koefisien determinan (R Square) menunjukkan nilai 0,7746 artinya bahwa model regresi yang diperoleh dapat menjelaskan 77,5% variasi variabel outcome.Atau dengan kata lain variabel age,height dan sex dapat menjelaskan variasi variabel fev sebesar 77,5%.Jadi model ini sangat baik,karena di bidang kesehatan masyarakat dikatakan baik bila nilai R-Square minimal sekitar 60%.

Sedangkan nilai adj-R square berhubungan dengan sample size,apabila nilai R square hampir sama dengan nilai adj R square berarti sampelnya cukup untuk model regresi ini.

Dari table diatas dapat diperoleh persamaan garis regresi,yaitu :

FEV= -4,449 + 0,0614*AGE + 0,105*HEIGHT + 0,1611*SEX

Dengan model persamaan ini kita dapat memperkirakan fev dengan menggunakan variable age,height dan sex.Bila nilai koefisien Beta positif menunjukkan hubungan yang positif,dan bila koefisien Beta negative menunjukkan hubungan negative.Nilai koefisien Beta juga dapat digunakan untuk mengetahui variable mana yang paling besar peranannya/pengaruhnya dalam menentukan variable outcome.Semakin besar nilai beta semakin besar pengaruhnya.Pada hasil diatas yang paling besar pengaruhnya adalah sex/jenis kelamin.

2 thoughts on “ANALISA MULTIPLE REGRESION DENGAN STATA 9.0

  1. Mohon tanggapannya: Syntax untuk analisis data RKD (riskesdas), menggunakan analisis complex karena disain sampling nya PPS, jadi ada strata, psu, dst. Mohon informasi, jikalau pernah mendapatkan pembelajaran syntax survei. Apa perbedaan makna ke 4 syntax dibawah ini. Apakah syntax terakhir akan mempengaruhi hasil riset nantinya, ataukah keseluruhannya diterapkan secara simultan untuk pengkondisian data yang akan di analisis.
    . svyset psu [pweight = inflate],strata(strata)
    pweight: inflate
    VCE: linearized
    Single unit: missing
    Strata 1: strata
    SU 1: psu
    FPC 1:

    . svyset [pweight = inflate ],strata(strata)
    pweight: inflate
    VCE: linearized
    Single unit: missing
    Strata 1: strata
    SU 1:
    FPC 1:

    . svyset psu [pweight = inflate],psu(psu)
    pweight: inflate
    VCE: linearized
    Single unit: missing
    Strata 1:
    SU 1: psu
    FPC 1:

    . svyset [pweight = inflate],strata(strata)
    pweight: inflate
    VCE: linearized
    Single unit: missing
    Strata 1: strata
    SU 1:
    FPC 1:

    . svyset psu [pweight = inflate],strata(strata)
    pweight: inflate
    VCE: linearized
    Single unit: missing
    Strata 1: strata
    SU 1: psu
    FPC 1:

    Sebagaimana diketahui untuk survey data sheet dilakukan pembobotan, karena sampel yg diambil tidak secara SRS, oleh karena itu dilakukan bobot normalisasi. Untuk variabel bobot/weight, variabel bobot sudah disiapkan oleh Riskesdas, yang ada didalam data set nya dimana untuk riskesdas per kab/kota per provinsi, untuk analisis seluruh indonesia bobot ini hrs dinormalisasi. Normalisasi bobot dilakukan supaya total sampelnya tidak berubah, tetap sama dengan total sampel responden dalam data.

    Terimakasih

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s