백견이 불여일타

고정 헤더 영역

글 제목

메뉴 레이어

백견이 불여일타

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (41)
    • Data Platform (21)
      • Elastic Stack (10)
      • Kafka (3)
      • 데이터 엔지니어링 (8)
    • Programming (16)
      • Java (14)
      • Python (1)
    • 실무이야기 (3)
    • 후기 (1)

검색 레이어

백견이 불여일타

검색 영역

컨텐츠 검색

bigdata

  • Docker-Compose로 Confluent Kafka 와 C3(Confluent Control Center) 설치

    2022.10.10 by leediz

  • [Elastic Stack] Elasticsearch 노드 역할

    2022.03.27 by leediz

  • [Elastic Stack] Filebeat multiple output 에러

    2022.03.16 by leediz

  • [Elastic Stack] Elasticsearch Index와 Shard 개념

    2022.03.03 by leediz

  • [Elastic Stack] Elasticsearch 주요 용어

    2022.02.24 by leediz

  • [Elastic Stack] Elasticsearch 특징

    2022.02.10 by leediz

  • Elastic Stack 이란?

    2022.01.24 by leediz

  • Windows 10에서 Docker Compose로 TLS가 적용된 Elastic Cluster 구성 - 7.16.3 버전

    2022.01.23 by leediz

Docker-Compose로 Confluent Kafka 와 C3(Confluent Control Center) 설치

Docker-Compose로 Confluent Kafka 와 C3(Confluent Control Center) 설치 이전 포스팅에서 Confluent에 대해 정말 간략하게 설명을 했었다. Confluent 라이센스를 적용하여 프로젝트를 짧게나마 해본 입장에서 여러 Confluent Ecosystem 중에서 C3(Confluent Control Center)를 유용하게 잘 사용했었기에 C3에 대해 소개할겸 이번 포스팅은 docker-copomse를 사용하여 kafka broker 클러스터와 C3(Confluent Control Center) 설치를 다뤄보겠다. Confluent란 Apache Kafka를 만든 멤버들이 창립한 회사로 Confluent Kafka와 함께 여러 컴포넌트와 기능을 추가한 유료 ..

Data Platform/Kafka 2022. 10. 10. 21:04

[Elastic Stack] Elasticsearch 노드 역할

[Elastic Stack] Elasticsearch 노드 역할 Elasticsearch 노드 종류 Elasticsearch 클러스터에서 노드 역할을 분리하는 이유 Elasticsearch는 여러 노드를 클러스터로 구성하여 사용할 수 있다. 클러스터를 구성한다는 뜻은 클러스터와 클러스터에 참여하는 노드들에 대한 관리가 필요하다는 의미이다. 또한 Elasticsearch는 단순히 데이터를 저장하는 데 그치지 않고 심화된 통계처리를 통한 분석작업 또는 유료 라이센스의 경우 Machine Learning 등의 작업을 할 수 있다. 작은 규모의 클러스터에서는 각각의 Elasticsearch 노드가 모든 작업을 처리해도 괜찮지만 대규모의 클러스터에서는 각각의 역할을 수행하는 노드를 설정하여 작업을 하도록 하는게 ..

Data Platform/Elastic Stack 2022. 3. 27. 14:14

[Elastic Stack] Filebeat multiple output 에러

[Elastic Stack] Filebeat multiple output 에러 사건의 발단 외부 사이트에서 빅데이터 프로젝트를 진행하던 중에 웹로그를 Kafka 토픽으로 적재해야 하는 요건이 나왔다. 그런데 이미 Filebeat를 사용해 웹로그를 읽어 Elasticsearch에 적재하고 있다고 한다. 그래서 우리 회사도 기존에 사용하던 Filebeat에 Kafka output만 추가하여 Kafka 토픽을 만드는 것으로 이야기를 마쳤다. 이 때만 해도 이전에 타 프로젝트에서 Logstash를 이용해 ETL 작업을 할 때, output plugin을 여러 개 사용했기 때문에 당연히 Filebeat에서도 Elasticsearch와 Kafka에 동시에 output 설정을 해서 적재를 하겠거니 라는 안일한 생각을..

Data Platform/Elastic Stack 2022. 3. 16. 22:53

[Elastic Stack] Elasticsearch Index와 Shard 개념

[Elastic Stack] Elasticsearch Index와 Shard 개념 인덱스(Index)와 샤드(Shard) 지난 포스팅에서 Elasticsearch에서 인덱스는 하나의 “논리적인 저장 단위”이고 샤드는 “물리적으로 노드에 저장되는 단위”라고 정의했었다. Elasticsearch나 다른 NoSQL 또는 Kafka와 같은 분산 처리 환경에 익숙하지 않다면 논리적인 저장 단위와 물리적으로 저장하는 단위가 나뉘어져 있다는 개념이 생소할 것이다. 특히 단일 노드로 Standalone 형식으로 테스트를 진행한다면 더더욱 이해가 어려울 수 있다. 하지만 분산 처리를 함으로써 수평 확장(Scale-Out)이 용이해지고 단일 노드의 물리적인 한계를 극복할 수 있다. 또한 처리량을 높여 오히려 퍼포먼스를 향..

Data Platform/Elastic Stack 2022. 3. 3. 21:44

[Elastic Stack] Elasticsearch 주요 용어

[Elastic Stack] Elasticsearch 주요 용어 Elasticsearch란 지난 포스팅에서 Elasticsearch에 대해 대표적인 특징에 대해 알아봤다. 이번 포스팅에서는 Elasticsearch에서 사용하는 주요 용어 일부에 대해 소개하겠다. Elasticsearch 주요 용어 노드 (Node) Elasticsearch는 노드(Node)라는 이름으로 실행이 된다. 또한 실행 중인 Elasticsearch를 인스턴스(instance)라고도 표현한다. 클러스터가 구성되는 단위이며 Elasticsearch가 설치되는 물리적 혹은 논리적 단위이다. 보통은 물리적인 서버(머신)에 노드 하나를 구성하는 방식을 권장하지만, 경우에 따라 단일 물리 서버에 복수개의 노드를 설치할 수도 있다. 클러스터..

Data Platform/Elastic Stack 2022. 2. 24. 22:20

[Elastic Stack] Elasticsearch 특징

[Elastic Stack] Elasticsearch 특징 Elasticsearch란 지난 포스팅에서 Elastic Stack에 대해 무엇인지 간략하게 소개했다. 이번에는 Elastic Stack의 심장인 Elasticsearch에 대해 좀 더 알아보며 핵심 용어들에 대해 소개하겠다. Elasticsearch의 특징 Apache Lucene 기반의 검색 엔진 Elasticsearch는 Apache Lucene이라는 Java 기반의 검색 엔진 라이브러리이다. 여기서 라이브러리 의 의미는 Lucene을 사용하고 싶을 경우 말 그대로 라이브러리로 다운받아 import를 시켜야 Lucene의 API를 사용할 수 있다는 뜻이고, 개발단에서 코드레벨로써만 활용할 수 있다는 점이다. 따라서 Java 언어의 의존성이 ..

Data Platform/Elastic Stack 2022. 2. 10. 21:05

Elastic Stack 이란?

Elastic Stack이란 출처 : https://www.elastic.co/kr/blog/getting-started-with-elastic-cloud Elastic Stack이란 Elasticsearch, Logstash, Kibana의 앞글자를 따서 ELK Stack이라고 불리던 기존의 아키텍처에서 Beats 제품군이 추가된 Elastic의 제품군들이다. 보통의 데이터 관련 작업을 수행하게 되면 일반적으로 수집 - 저장/처리 - 분석/시각화 등의 단계를 거치게 된다. Elastic Stack의 그림을 보면 Beats/Logstash - Elasticsearch - Kibana의 순서대로 아래서 위로 올라가게 되는데 Beats/Logstash는 데이터 수집 단계, Elasticsearch는 저장/처..

Data Platform/Elastic Stack 2022. 1. 24. 23:16

Windows 10에서 Docker Compose로 TLS가 적용된 Elastic Cluster 구성 - 7.16.3 버전

Windows 10에서 Docker Compose로 TLS가 적용된 Elastic Cluster 구성 - 7.16.3 버전 Single Node로 Elasticsearch와 Kibana를 설치하여 테스트할 수도 있지만, 테스트가 아닌 운영환경에서는 단 3개의 노드라도 Cluster를 구성해서 사용하게된다. 개인적으로 테스트를 위해 Cluster구성을 하려면 물리적인 서버부터 제약이 생긴다. VirtualBox나 VMWare를 설치하여 Cluster구성을 할 수도 있지만 OS Setting부터 번거로운일이 굉장히 많다. 다행히 Docker Compose를 이용하여 Elastic Cluster를 구성하는 예제가 Elastic 공식문서에 있다. 이번 포스팅에서는 Windows10 환경에서 TLS까지 적용된 E..

Data Platform/Elastic Stack 2022. 1. 23. 17:36

추가 정보

인기글

최신글

페이징

이전
1 2
다음
leediz
백견이 불여일타 © KM
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바