지식나눔

생물통계처리

분석데이터가 다양하게 나오는 경우 인공지능적 분석툴이 유요할것 같은데요. 공개된 웹툴들은 어떤게 좋겠는지요? 조언부탁드립니다. 감사합니다.
  • 통계분석
  • 인공지능
지식의 출발은 질문, 모든 지식의 완성은 답변! 
각 분야 한인연구자와 현업 전문가분들의 답변을 기다립니다.
답변 10
  • 답변

    김수진님의 답변

    데이터 분석을 하는데 있어 간단하게 분석해볼 수 있는 프로그램으로 WEKA (https://www.cs.waikato.ac.nz/ml/weka/)라는 프로그램이 있습니다. 기계학습 기반 다양한 모델들을 구현해 놓은 tool로 JAVA 기반으로 되어 있으며 WEKA의 입력데이터 포맷(*.arff)로 형식만 맞추어 주면 쉽게 본인이 가지고 있는 데이터를 분석해 볼 수 있습니다. class가 있는 labeded data는 다양한 classfication 모델(DT, NN, SVM, BN 등등)을 적용시켜 분류/예측/진단을 해 볼수 있으며, class가 없는 데이터는 clustering 방법 등을 기반으로 분석해 볼 수 있습니다. 또한 entropy 기반의 information gain 등 데이터를 구성하고 있는 feature 들의 정보량도 계산 할 수 있습니다. 데이터 마이닝 소프트웨어로 손쉽게 사용 할 수 있으며 각 운영체제에 맞추어 설치하여 데이터 분석시 사용하시면 됩니다. 사용하는 방법은 약간의 검색을 통하면 됩니다^^.
    데이터 분석을 하는데 있어 간단하게 분석해볼 수 있는 프로그램으로 WEKA (https://www.cs.waikato.ac.nz/ml/weka/)라는 프로그램이 있습니다. 기계학습 기반 다양한 모델들을 구현해 놓은 tool로 JAVA 기반으로 되어 있으며 WEKA의 입력데이터 포맷(*.arff)로 형식만 맞추어 주면 쉽게 본인이 가지고 있는 데이터를 분석해 볼 수 있습니다. class가 있는 labeded data는 다양한 classfication 모델(DT, NN, SVM, BN 등등)을 적용시켜 분류/예측/진단을 해 볼수 있으며, class가 없는 데이터는 clustering 방법 등을 기반으로 분석해 볼 수 있습니다. 또한 entropy 기반의 information gain 등 데이터를 구성하고 있는 feature 들의 정보량도 계산 할 수 있습니다. 데이터 마이닝 소프트웨어로 손쉽게 사용 할 수 있으며 각 운영체제에 맞추어 설치하여 데이터 분석시 사용하시면 됩니다. 사용하는 방법은 약간의 검색을 통하면 됩니다^^.
    등록된 댓글이 없습니다.
  • 답변

    김미숙님의 답변

    분석데이터로 어떤 결과를 얻고자 함에 따라 다양합니다.

    1. 통계적인 처리결과만 원하시면 => 위에서 말씀하신 WEKA, SAS, SPSS 등등 모든 통계프로그램이 모두 가능합니다.
    2. 통계자료를 이용하여 직접 인공지능 프로그램 구현을 원하시면 => R이나 파이썬(특히, Tensorflow를 사용하시기를 추천합니다..

     
    분석데이터로 어떤 결과를 얻고자 함에 따라 다양합니다.

    1. 통계적인 처리결과만 원하시면 => 위에서 말씀하신 WEKA, SAS, SPSS 등등 모든 통계프로그램이 모두 가능합니다.
    2. 통계자료를 이용하여 직접 인공지능 프로그램 구현을 원하시면 => R이나 파이썬(특히, Tensorflow를 사용하시기를 추천합니다..

     
    등록된 댓글이 없습니다.
  • 답변

    윤정선님의 답변

    빅데이터 분석 기술에는
    1. 하둡(Hadoop)
    2. R
    3. 마훗(Mahout)
    4. NoSQL
    생물통계처리는 2번을 추천합니다.
    빅데이터 인프라 기술에는 턱스트 마이닝(Text Mining) 추천합니다.  

     
    빅데이터 분석 기술에는
    1. 하둡(Hadoop)
    2. R
    3. 마훗(Mahout)
    4. NoSQL
    생물통계처리는 2번을 추천합니다.
    빅데이터 인프라 기술에는 턱스트 마이닝(Text Mining) 추천합니다.  

     
    등록된 댓글이 없습니다.
  • 답변

    조준석님의 답변

    저도 R 추천합니다.
    구글에 원하는 그래프나 목적을 쳐보시면 소스들이 다양하고 자세하게 제공됩니다.
    저도 R 추천합니다.
    구글에 원하는 그래프나 목적을 쳐보시면 소스들이 다양하고 자세하게 제공됩니다.
    등록된 댓글이 없습니다.
  • 답변

    이상후님의 답변

    Open Source Epidemiologic Statistics for Public Health
    ; https://www.openepi.com/Menu/OE_Menu.htm
    Open Source Epidemiologic Statistics for Public Health
    ; https://www.openepi.com/Menu/OE_Menu.htm
    등록된 댓글이 없습니다.
  • 답변

    양현모님의 답변

    생물통계처리 관련해서 좀 생각하다가 파이썬 이냐 R 이냐를 놓고 고민한 적이 있고 지금도 고민하고 있습니다. 잘 하시는 분은 아무거나 하나만 하면 된다고 하던데요. 솔직히 파이썬이 대세이기도 하고 다양한 활용 접목 분야가 있어서 파이썬을 제대로 배우시면 좋을 것 같아요. 
    생물통계처리 관련해서 좀 생각하다가 파이썬 이냐 R 이냐를 놓고 고민한 적이 있고 지금도 고민하고 있습니다. 잘 하시는 분은 아무거나 하나만 하면 된다고 하던데요. 솔직히 파이썬이 대세이기도 하고 다양한 활용 접목 분야가 있어서 파이썬을 제대로 배우시면 좋을 것 같아요. 
    등록된 댓글이 없습니다.
  • 답변

    류정우님의 답변

    안녕하세요,,... Weka를 추천드립니다.....
    안녕하세요,,... Weka를 추천드립니다.....
    등록된 댓글이 없습니다.
  • 답변

    김태훈님의 답변

    통계처리에 관하여 공개된 웰툴로는 저도 위의 분과 같이 파이썬을 추천드립니다.
    다양한 적용 예를 통하여 쉽게 접근하실 수 있을 것입니다.
    좋은 결과 바랍니다!
    통계처리에 관하여 공개된 웰툴로는 저도 위의 분과 같이 파이썬을 추천드립니다.
    다양한 적용 예를 통하여 쉽게 접근하실 수 있을 것입니다.
    좋은 결과 바랍니다!
    등록된 댓글이 없습니다.
  • 답변

    이광호님의 답변

    저는 R 추천합니다.
    저는 R 추천합니다.
    등록된 댓글이 없습니다.
  • 답변

    김연진님의 답변

    간단한 통계라면 SPSS를 사용하구요. 좀 더 전문적으로 본다면 통계학 전문가를 통하거나 상기 분들이 말씀 하시는 것 중에서는 R을 주로 사용합니다.
    간단한 통계라면 SPSS를 사용하구요. 좀 더 전문적으로 본다면 통계학 전문가를 통하거나 상기 분들이 말씀 하시는 것 중에서는 R을 주로 사용합니다.
    등록된 댓글이 없습니다.