일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- openai
- Reinforcement Learning
- Artificil Intelligence
- 꿈
- machine learning
- 인공지능
- 신경망
- deep learning
- 강화학습
- Andrej Karpathy
- Hvass-Lab
- 행복
- 질문
- DeepLearning
- TensorFlow Tutorials
- 번역
- 사랑
- SAS
- Tutorial
- 매크로
- 머신러닝
- 세상
- neural networks
- 답변
- tutorials
- 한국어
- SQL
- cs231n
- 딥러닝
- tensorflow
- Today
- Total
목록SAS (45)
Economics & Deeplearning
요즘 IML 공부하는데 참 어렵네요.익숙해 지는데 시간이 필요할 거 같아요. 혹시 해보신 분 계시면 좀 알려주세요.================================================================================proc iml; x={1 2 3 4, 5 6 7 8, 9 10 11 12, 13 14 15 16}; k=diag(x); do i=1 to 4; do j=1 to 4; if k[i,j] = 0 then k[i,j]=.; end;end; z=countn(k); print x, k, z; quit;대각행렬을 뽑고 대각행렬에서 0인 값은 missing 으로 만들고 나머지의 갯수를 셉니다.
1 11111011101110111 2 11111110011111110 3 11111111111110111 4 00000000100011010... ...위와 같은 데이터를 불러들일 때 간단한 방법 없을까요?....아래같이 일일이 지정하는거 말고~~~~ data a; infile "D:\data\data1.dat" missover pad; input @1 id $2. @21 x1 1. @22 x2 1. @23 x3 1. @24 x4 1. @25 x5 1. @26 x6 1. @27 x7 1. @28 x8 1. @29 x9 1. @30 x10 1. @31 x11 1. @32 x12 1. @33 x13 1. @34 x14 1. @35 x15 1. @36 x16 1. @37 x17 1. ; run;=======..
vehno 1,2 를 포함하는 casenum만 남기고 나머지 변수를 분석하기 위해서, 나머지 casenum는 지워야 합니다. CASENUM VEHNO BODYTYPEINJSEVERITY2011104292521 Passenger CarInjury2011104292522 Light TruckInjury2011104293172 Passenger CarInjury2011104293181 Light TruckInjury2011104293541 Passenger CarInjury2011104294051 Passenger CarInjury 같은 casenum로 그룹핑 시키기 위해서 lag를 사용했지만, 나머지 casenum는 지울 수 없었습니다. 혹시 다른 방법에 대해서 알려주시면 너무 감사하겠습니다. =======..
데이터셋은 아래와 같구요,DATA pay; INPUT NAME $ month $ PAY; CARDS; 홍길동 1월 100 홍길동 2월 200 홍길동 3월 300 홍길동 4월 300 홍길동 5월 200 홍길동 6월 400 홍경래 1월 200 홍경래 2월 200 홍경래 3월 300 홍경래 4월 200 홍경래 5월 400 홍경래 6월 300 김유신 1월 100 김유신 2월 200 김유신 3월 300 김유신 4월 400 김유신 5월 500 김유신 6월 600 김춘추 1월 300 김춘추 2월 300 김춘추 3월 300 김춘추 4월 300 김춘추 5월 300 김춘추 6월 300 ; run;proc sort data=pay out=pay_sort; by name descending pay; run; NAMEMONTH..
만약 남자 여자가 각각 7638명 3000명 있다고 한다면 이것을 24:5의 비율로 맞추고자 합니다. 손으로 계산하면 일단 남자는 7638명 다 들어가고 여자의 경우는 7638/24=318 , 318*5=1590 이런식으로 나와서 결국 남자는 7638, 여자는 1590명으로 잡으면 됩니다. 이것을 sas로 구현할수 있는 방법없을까요?? proc surveyselect strata는 24:5로 줘버리면 남자에서 24%를 뽀고 여자에서 5%를 뽑기때문에 절대 이런식으로 안나오고 그나마 구현한것은 proc surveyselect data=test1 out=test2 method=srssampsize=1590; run; 이런식으로 해서 1590까지는 수기로 구한다음 이 1590명을 랜덤 샘플링하는것인데 이건 왠..
fh_20021; fh_20022; fh_20031; fh_20032; fh_20041; 이와 같은 자료가 있습니다. 실제로는 이보다 더 많은데, 한번에 매크로 이용하여 sort하려고 합니다. %macro sort; proc sort data=fh_2000&!&&j; by var1; %do i=2 %to 9; %do j=1 %to 2; run; %end; %end; %mend; %sort; 이랬더니, 에러 메세지가 떠요. 조금만 손보면 될 듯 한데.. 거기가 어딘지 ? ^-^ 혹시 통계전공하신 분은 저보다는 쉽게 답을 찾을 수 있지 않을까요? ================================================================================%macro sort..
제가 작업을 하고 있는데요..a라는 변수안에 숫자형 데이터가 들어있습니다.정수와 소수점을 포함한 숫자들도요..예를 들어 -> a={1, 1.1, 1.5, 3}이러한 데이터셋인데,소숫점을 가지고 있는 값들만 100을 곱하려고 하거든요..방법 없을까요...?================================================================================data temp;input x; cards; 1 1.1 1.5 3 ; run; data temp2; set temp; if mod(x,1) then y=x*100; else y=x; run;
안녕하세요 사스라는게 변수끼리 지지고 볶고 하는건데 관측치 끼리 비교할려니까 잘 안되네요. 도움을 주시면 감사하겠습니다. 일단 제가 가지고 있는 데이터는 주민번호 별로 날짜가 최근것부터 좍 있습니다. 예를들면 2013080920130731201306152013060120130410.. 이렇게 있다고 치면 가장 최근것은 무조건 keep하고 그 다음것과 비교해서 30일 초과만 keep하고 아니면 버리는 것입니다. 그래서 그 keep한것에서 다시 시작하면서 비교하는것인데 위에예를 제가 해보면20130809 ---> keep20130731 ---> 20130809와 비교해서 30일이 초과가 안되었기 때문에 drop20130615 ---> 다시 20130809와 비교해서 30일 초과기 때문에 keep2013060..
최근에 sas을 배워서 많이 이 카페를 이용하고 있습니다. 많은 도움을 받아서 항상 감사합니다 제가 궁금한 내용은 제가 한 code를 단순하게 짤 수 있는 방법을 알고 싶습니다,책을 통하여 macro를 사용하면 될 것 같은데 몇시간 해도 자꾸 에러만 나옵니다.지금 한 내용은 변수가 많지 않아서 하나씩 했지만 나중에 변수가 증가하면 힘들 것 같아서 조언을 구합니다. 고수분들의 도움을 요청합니다. DATA a1; INFILE t1 LRECL=1000000; INPUT f1 f2 f3 f4 f......... f49 mk; proc reg; model f1 = mk; run; proc reg; model f2 = mk; run; proc reg; model f3 = mk; run; ......... proc ..
안녕하세요.SAS데이타셋을 변경해야 할 상황인데 코딩을 어떻게 해야 하는지 감이 안잡힙니다.도움 주시면 정말 감사하겠습니다. 일단 원래의 데이타파일은 다음과 같이 구성되어 있습니다. hid pid01 amt01 pid02 amt02 pid03 amt03 hasset1 1001 100 10002 2001 200 2002 300 2003 400 20003 3002 500 3003 600 30004 40005 5001 700 5003 800 5000 상기 데이타의 내용은 hid가 가구번호이고 가구원이 최대 3명이라고 할 때pid01은 특정항목에 지출한 가구원번호이고 mat01은 그 금액인데이 특정항목을 지출한 가구원의 수는 0명에서 3명까지 불규칙하며지출이 있는 첫번째 가구원번호과 pid01에 들어있습니다. ..