지식나눔

open data란 구체적으로 무엇을 의미하는가요?

안녕하세요
책을 읽다가 open-data의 용어를 접하게 되었는데, 구글에서 검색해보니  설명이 더 어렵네요
아래와 같이 설명이 되어있는데요

구체적인 예를 들어주면 좋을 텐데, 구체적이지 않은 개념 설명이라 명확히 알 수 없어요?

혹시 알려 주실 수 있으실까요?

예컨대 vscode, python 등 우리가 맘대로 무료로 다운 받을 수 있는 것들이 open data인가요?

좋은 주말 되십시요
------------------------------------------------------------------------------------------------------------------------------

본 핸드백은 열린 데이터에 대한 것인데 그렇다면 열린 데이터는 정확히 무엇인가? 특히 무엇이 열린 데이터를 공개하게 만드나? 어떤 형태의 데이터에 대해 논의하는가?

공개란 무엇인가?

본 핸드북은 열린 데이터에 것인데 - 그런데 열린 데이터는 정확히 무엇인가? 우리의 목적을 위해 열린 데이터는 Open Definition:에 정의된 그대로이다.

열린 데이터는 모든 사람이 자유롭게 사용 및 재사용이 가능하며 재배포할 수 있는 데이터이다 - 저작권 표시 및 동일조건 변경 허락의 조건에서.

완전한 오픈 정의_ 는 열린 데이터의 의미에 대한 상세한 설명을 제공한다. 가장 중요한 것을 정리하면:

  • 이용성 및 접근: 전체 데이터가 이용가능해야 하며, 합리적인 재생산 비용으로, 가능하면 인터넷에서 다운로드되어야 한다. 데이터는 편리하고 수정 가능한 형태로 제공되어야 한다.
  • 재사용과 재배포: 데이터는 서로 다른 데이터와 결합되는 것을 포함하여 재사용과 재배포를 허용하는 조건으로 제공되어야 한다.
  • 보편적 참여: 누구나 데이터를 사용, 재사용 및 재배포할 수 있어야 한다 -  활동 분야, 특정한 사람이나 그룹에 대한 차별이 없어야 한다. 예를 들어, ‘비상업적’ 제한조건은 ‘상업적’ 사용을 제한할 수 있으며, 특정한 목적에 한정된 사용조건은 (예: 교육적 목적에 한정)은 허용되지 않는다.

공개라는 의미와 이러한 정의가 사용된 이유의 중요성이 명확하지 않다면, 간단한 답은: 상호운용성이다.

상호운용성은 다양한 시스템과 조직이 함께 동작할 수 있는 (상호 정보 교환이 가능한) 능력을 뜻한다. 여기서는 서로 다른 데이터셋 사이의 상호 운용 - 또는 혼합할 수 - 있는 능력을 말한다.

상호운용성은 서로 다른 컴포넌트들이 함께 동작할 수 있게 한다는 점에서 그 중요성이 있다. 컴포넌트

를 구성하고 컴포넌트를 ‘함께 연결하는’ 능력은 광범위하고, 복잡한 시스템을 구축하기 위해 필수적이다. 상호운용성 없이 이런 시스템을 구축하는 것은 거의 불가능하다 - 가장 유명한 신화인 바벨탑에서 증명되었듯이, 상호소통 (상호운용을 위한) (무)능력은 탑을 건축하는 노력의 완벽한 붕괴에 영향을 주었다.

우리는 데이터와 관련하여 비슷한 상황에 직면하고 있다. 데이터 ‘공유’ (또는 코드)의 핵심은 그 안에 포함된 한 조각의 “공개된’ 자료가 “공개된” 다른 자료와 자유롭게 상호 결합될 수 있는 것이다. 이러한 상호운용성은 “공개성”의 핵심적이며 실용적인 혜택을 실현하는 핵심이다: 서로 다른 데이터셋을 극적으로 연결하고 조금 더 향상된 제품과 서비스를 개발하기 위한 강화 능력 (이러한 혜택은 ‘왜’ 데이터를 공개하나 섹션에서 자세히 다룬다).

공개성의 명확한 정의가 제공하는 것은 서로 다른 두 개의 데이터 소스가 공개되었을 때, 데이터를 상호 결합하는 것이 가능한 것이며, 동시에 **스스로만을 위한 ‘바벨탑’을 피할 수 있다는 것을 보장하는 것이다: 수많은 데이터셋이 있으나 실제 가치가 있는 규모가 큰 시스템에 데이터셋을 결합시키지 못하는 경우

어떤 데이터를 말하는 것인가?

여러분은 이미 공개되거나 공개될 가능성이 있는 데이터의 사례를 살펴보았다 - 보다 다양한 예를 아래에서 볼 수 있다. 그러나 어떤 종류의 데이터가 오픈되었는지 또는 오픈될 것인지 요약하는 것이 도움이 될 것이다 – 어떤 것이 공개되지 않는지도 마찬가지로 중요하게.

가장 중요한 점은 데이터를 공개할 때 초점이 개인적이지 않은 데이터에 있다는 것이다. 즉, 데이터는 특정한 개인에 대한 정보를 포함하지 않아야 한다.

유사하게, 정부 데이터 중에 국가 보안 제안 조건이 적용될 수 있다.



 

  • 오픈 데이터
  • 상호 운용성
  • 데이터 소스 공개성
지식의 출발은 질문, 모든 지식의 완성은 답변! 
각 분야 한인연구자와 현업 전문가분들의 답변을 기다립니다.
답변 3
  • 채택

    장세호님의 답변

    공개 데이터  상업적인 경우를 포함하여 모든 사람이 공개적으로 액세스, 활용, 편집 및 공유할 수 있는 데이터입니다. 오픈 데이터는 오픈 라이선스에 따라 라이선스가 부여됩니다 . [1] [2] [3]

    일부 데이터는 저작권, 특허 또는 기타 통제 메커니즘의 제한 없이 모든 사람이 자유롭게 사용하고 원하는 대로 다시 게시할 수 있어야 합니다. [3] 오픈 소스 데이터 운동의 목표는 오픈 소스 소프트웨어, 하드웨어 , 공개 콘텐츠 , 공개 사양 , 공개 교육 , 공개 교육 자원 , 공개 정부 와 같은 다른 "공개(-소스)" 운동의 목표와 유사합니다. 오픈 지식 , 오픈 액세스 , 오픈 사이언스 , 오픈 웹. 오픈 데이터 운동의 성장은 지적 재산권의 증가와 병행합니다. [4]오픈 데이터에 대한 철학은 오랫동안 확립되어 왔지만(예를 들어 머튼의 과학 전통에서 ) "오픈 데이터"라는 용어 자체는 최근에 생겨 인터넷과 월드 와이드 웹 의 부상 , 특히 출시와 함께 인기를 얻고 있습니다. Data.gov , Data.gov.uk 및 Data.gov.in 과 같은 개방형 데이터 정부 이니셔티브

    열린 데이터는 연결된 데이터 일 수도 있으며 연결된 열린 데이터 라고 합니다 .

    공개 데이터의 가장 중요한 형태 중 하나는 정부 기관이 만든 공개 데이터 형식인 OGD(Open Government Data)입니다. 열린 정부 데이터의 중요성은 정부에서 멀리 떨어져 있는 가장 일상적이고 일상적인 작업에 이르기까지 시민의 일상 생활의 일부가 되는 것에서 비롯됩니다.

    약어 FAIR/O 데이터 는 문제의 데이터세트 또는 데이터베이스가 FAIR 데이터 의 원칙을 준수 하고 명시적인 데이터 가능 오픈 라이선스 를 포함한다는 것을 나타내기 위해 때때로 사용됩니다 .
    출처: wikipedia
    추가 정보는 https://en.wikipedia.org/wiki/Open_data 를 참고하세요.(크롬에서 여시고 한국어로 전환하시면 편합니다. ^^)

     

    공개 데이터  상업적인 경우를 포함하여 모든 사람이 공개적으로 액세스, 활용, 편집 및 공유할 수 있는 데이터입니다. 오픈 데이터는 오픈 라이선스에 따라 라이선스가 부여됩니다 . [1] [2] [3]

    일부 데이터는 저작권, 특허 또는 기타 통제 메커니즘의 제한 없이 모든 사람이 자유롭게 사용하고 원하는 대로 다시 게시할 수 있어야 합니다. [3] 오픈 소스 데이터 운동의 목표는 오픈 소스 소프트웨어, 하드웨어 , 공개 콘텐츠 , 공개 사양 , 공개 교육 , 공개 교육 자원 , 공개 정부 와 같은 다른 "공개(-소스)" 운동의 목표와 유사합니다. 오픈 지식 , 오픈 액세스 , 오픈 사이언스 , 오픈 웹. 오픈 데이터 운동의 성장은 지적 재산권의 증가와 병행합니다. [4]오픈 데이터에 대한 철학은 오랫동안 확립되어 왔지만(예를 들어 머튼의 과학 전통에서 ) "오픈 데이터"라는 용어 자체는 최근에 생겨 인터넷과 월드 와이드 웹 의 부상 , 특히 출시와 함께 인기를 얻고 있습니다. Data.gov , Data.gov.uk 및 Data.gov.in 과 같은 개방형 데이터 정부 이니셔티브

    열린 데이터는 연결된 데이터 일 수도 있으며 연결된 열린 데이터 라고 합니다 .

    공개 데이터의 가장 중요한 형태 중 하나는 정부 기관이 만든 공개 데이터 형식인 OGD(Open Government Data)입니다. 열린 정부 데이터의 중요성은 정부에서 멀리 떨어져 있는 가장 일상적이고 일상적인 작업에 이르기까지 시민의 일상 생활의 일부가 되는 것에서 비롯됩니다.

    약어 FAIR/O 데이터 는 문제의 데이터세트 또는 데이터베이스가 FAIR 데이터 의 원칙을 준수 하고 명시적인 데이터 가능 오픈 라이선스 를 포함한다는 것을 나타내기 위해 때때로 사용됩니다 .
    출처: wikipedia
    추가 정보는 https://en.wikipedia.org/wiki/Open_data 를 참고하세요.(크롬에서 여시고 한국어로 전환하시면 편합니다. ^^)

     

    우선 답변 감사합니다
    그러면 우리가 마음대로 무료로 다운로드해서 사용하는 python, vscode 등이 다 open data인가요?
    구체적으로 예를 들어 주셔야 이해 가능할 것 같네요
    그리고 오픈 소스와 오픈 데이터는 동일한 단어인가요?

  • 채택

    장세호님의 답변

    Open Source / FOSS(Free and Open-Source Software)[1]

    어떤 소프트웨어 프로그램을 개발하는 과정에 필요한 소스 코드나 설계도를 누구나 접근해서 열람할 수 있도록 공개하는 것. 보통 소스가 공개된 소프트웨어를 '오픈 소스 소프트웨어'라고 하고, 소프트웨어 말고도 개발 과정이나 설계도가 공개되는 경우 하드웨어에도 오픈 소스 모델이 적용할 수 있으며, 글꼴과 같은 데이터에도 오픈 소스 개발 모델이 적용되는 경우가 있다. 오픈 소스를 채택했다고 해서 무료 프로그램일 필요는 없다. 오프소스 프로그램을 유료 프로그램으로 판매도 가능하다.

    단순히 소스를 공개만 하는 것이 아니라, 이를 2차 창작하는 것을 허용하기도 하고, 나아가 조건 없이 상업적 용도로까지 사용할 수 있게 하는 경우가 있다. 물론 공개만 하고 2차 창작이 안 되는 경우도 있기는 하지만 이 경우는 보통 '오픈 소스'라고 부르지 않는다.
    출처: 나무위키(오픈 소스 - 나무위키 (namu.wiki))
    제가 전문가가 아니라 정확히 구분은 못하겠지만 찾아본 바로는 python, vscode는 오픈소스인 것 같습니다.
    오픈소스와 오픈데이터는 같은 단어는 아니지만 확장된 개념인 것으로 생각됩니다.
    Open Source / FOSS(Free and Open-Source Software)[1]

    어떤 소프트웨어 프로그램을 개발하는 과정에 필요한 소스 코드나 설계도를 누구나 접근해서 열람할 수 있도록 공개하는 것. 보통 소스가 공개된 소프트웨어를 '오픈 소스 소프트웨어'라고 하고, 소프트웨어 말고도 개발 과정이나 설계도가 공개되는 경우 하드웨어에도 오픈 소스 모델이 적용할 수 있으며, 글꼴과 같은 데이터에도 오픈 소스 개발 모델이 적용되는 경우가 있다. 오픈 소스를 채택했다고 해서 무료 프로그램일 필요는 없다. 오프소스 프로그램을 유료 프로그램으로 판매도 가능하다.

    단순히 소스를 공개만 하는 것이 아니라, 이를 2차 창작하는 것을 허용하기도 하고, 나아가 조건 없이 상업적 용도로까지 사용할 수 있게 하는 경우가 있다. 물론 공개만 하고 2차 창작이 안 되는 경우도 있기는 하지만 이 경우는 보통 '오픈 소스'라고 부르지 않는다.
    출처: 나무위키(오픈 소스 - 나무위키 (namu.wiki))
    제가 전문가가 아니라 정확히 구분은 못하겠지만 찾아본 바로는 python, vscode는 오픈소스인 것 같습니다.
    오픈소스와 오픈데이터는 같은 단어는 아니지만 확장된 개념인 것으로 생각됩니다.

    아네, 그렇군요... 답변을 잘 해주셔도 제가 지식이 너무 짧아 제대로 이해를 못했던 것 같습니다.
    이제는 뭐를, 제가 잘모르는 건지 판단하는 것 만으로도 큰 수확인 것 같습니다, 한층 더 이해가 깊어졌습니다~
    감사합니다~

    즐거운 추석 되십시요

  • 답변

    진승교님의 답변

    안녕하세요.


    최근에는 소스코드를 공개하는 것을 넘어서 데이터셋를 공개하는 추세가 있는 것 같습니다.

    저희 정보는 공공데이터포털 https://www.data.go.kr/ 에서 정부의 여러 데이터를 활용할 수 있도록 공개하고 있습니다.


    말씀하신 vscode, python은 프로그램을 개발하기 위한 프로그램 (통합개발환경,IDE)나 프로그래밍 언어입니다.

    vscode 프로그램에서 python으로 프로그램을 개발할 수 있죠.

    비유하면 한글(hwp) 프로그램에서 영어로 문서를 작성하는 것으로 치환할 수 있을것 같습니다.

    안녕하세요.


    최근에는 소스코드를 공개하는 것을 넘어서 데이터셋를 공개하는 추세가 있는 것 같습니다.

    저희 정보는 공공데이터포털 https://www.data.go.kr/ 에서 정부의 여러 데이터를 활용할 수 있도록 공개하고 있습니다.


    말씀하신 vscode, python은 프로그램을 개발하기 위한 프로그램 (통합개발환경,IDE)나 프로그래밍 언어입니다.

    vscode 프로그램에서 python으로 프로그램을 개발할 수 있죠.

    비유하면 한글(hwp) 프로그램에서 영어로 문서를 작성하는 것으로 치환할 수 있을것 같습니다.

    등록된 댓글이 없습니다.