AWS 파트너 AI 클라우드 솔루션 컨퍼런스 참석 후, 제조 AI 트렌드와 Physical AI, Digital Twin, Agentic AI에 대한 인사이트를 얻음. AI Observability의 중요성과 Datadog과 Dynatrace의 AI 기반 시스템 운영 방법을 학습함. 현대오토에버의 스마트 안전 통합관제 시스템 및 플랫폼 서비스 엔지니어 관점에서의 Observability의 시사점을 살펴봄. AI가 엔지니어의 역할을 변화시키고 있다는 전반적인 생각을 얻음.
ReadApache Kafka는 분산처리 성능, 가용성, 에코시스템 면에서 가장 우수하여 대용량/고가용성이 요구될 때 최적이고, AWS SQS는 운영 부담이 낮고 유지보수성이 뛰어나 소규모/단순 구조에 적합하다. Kafka는 Consumer Group 단위로 동일 메시지를 여러 도메인 시스템이 독립적으로 수신할 수 있어 분산 처리에 구조적 강점이 있고, SQS는 Queue당 메시지 1회 소비 삭제 방식으로 중복 처리 부담이 적다. MQTT(Mosquitto)는 IoT/모바일 Device 간 인터페이스에 적합하며, 서버 애플리케이션 간 인터페이스에는 적합하지 않다는 결론 → 서버 간은 Kafka 또는 SQS, 모바일 대상은 AWS IoT 도입을 제안.
Readaws-secretsmanager-jdbc 방식은 설정이 단순하나 Driver 고정 및 Credentials Provider Chain 오동작 위험이 있어, Spring Cloud AWS + DataSource Java Bean 방식을 권장한다. 환경별로 @Profile을 통해 로컬은 JVM 옵션의 Access Key로, 서버 환경은 EC2 IAM Role로 AWS 인증을 분리 구성한다. GetSecretValueResult에서 가져온 JSON 문자열을 DataSourceSecrets 모델에 Jackson으로 매핑하여 DB 접속 정보를 동적으로 주입한다.
ReadSQS의 DLQ(Dead Letter Queue)는 여러 번 처리에 실패한 메시지를 별도 큐로 분리 저장하는 구조다. 메시지는 설정한 재시도 횟수(maxReceiveCount)를 초과하면 자동으로 DLQ로 이동되어 메인 큐의 처리 흐름을 방해하지 않는다. 이를 통해 실패 메시지를 분석·재처리하고, 전체 시스템의 안정성과 장애 대응력을 높일 수 있다.
ReadSQS는 간단한 메시지 큐 기반으로 서비스 간 비동기 처리와 디커플링에 적합한 서비스다. 반면 MSK(Kafka)는 고속·대용량 데이터 스트리밍과 실시간 처리, 이벤트 기반 아키텍처에 최적화된 플랫폼이다. 즉, 단순 메시지 전달이면 SQS, 실시간 스트리밍·분석까지 필요하면 MSK를 선택하는 것이 핵심 기준이다.
ReadAWS는 온디맨드 기반의 클라우드 서비스로, 서버·스토리지·네트워크를 API로 유연하게 확장/축소하며 사용한 만큼 비용을 지불하는 구조이다. EC2, EBS, S3, RDS, DynamoDB 등 다양한 서비스와 Auto Scaling, ELB를 통해 확장성과 고가용성을 확보할 수 있다. 클라우드는 초기 비용 절감과 운영 편의성이 있지만, 보안·비용 관리·벤더 종속성 등 고려사항이 있으며 이중화 설계가 중요하다.
Read