안녕하세요^^ ELB를 통해 서버 두대로 TCP 프로토콜을 분배하고 있는데요. 오늘…

안녕하세요^^

ELB를 통해 서버 두대로 TCP 프로토콜을 분배하고 있는데요. 오늘 동접자가 많긴 했는데 그 이후로 클라우드 워치를 보면 surge queue가 계속 증가하는 그래프가 나타납니다. 제가 statistic 기본(maximum)으로 설정했었는데 잘못 보고 있는 건가요? 실제 서비스에는 문제가 없는데 주말을 앞두고 지표에 문제가 있는건지 궁금해서요. 아시는분들 있으시면 고견 부탁드립니다 ㅠ

안녕하세요^^

ELB를 통해 서버 두대로 TCP 프로토콜을 분배하고 있는데요. 오늘 동접자가 많긴 했는데 그 이후로 클라우드 워치를 보면 surge queue가 계속 증가하는 그래프가 나타납니다. 제가 statistic 기본(maximum)으로 설정했었는데 잘못 보고 있는 건가요? 실제 서비스에는 문제가 없는데 주말을 앞두고 지표에 문제가 있는건지 궁금해서요. 아시는분들 있으시면 고견 부탁드립니다 ㅠ

11 thoughts on “안녕하세요^^ ELB를 통해 서버 두대로 TCP 프로토콜을 분배하고 있는데요. 오늘…

  1. 일반적으로 surge queue의 경우 평소 대비 일시적으로 요청이 증가 될 경우 ELB에서 Ec2 인스턴스로 전달 되지 못한 패킷을 큐에 쌓아 일부 유저들은 지연이 있는 경우 발생 하는 것으로 알고 있습니다. EC2 서버 에러로그와 EC2 인스턴스 커넥션 에러 등도 함께 모니터링하여 접속 오류 현상등이 발생 된다면 ELB 처리량 증가를 위해 미리 ELB Pre-warming 신청을 AWS support 측에 요청하는 것이 보다 안정적인 서비스에 도움이 될 듯 합니다. 참고 부탁 드립니다.

  2. 동시 접속자수가 많다면 인스턴스 scale up이나 out을 고려하시거나, 아니면 오토스케일링을 설정해 보세요..Elb의 각 존간 로드발란싱이 정상작동하는지도 확인해보시구요. Elb에서 인스턴스를 뺏다가 다시 넣어보시는것도 방법이겠네요.

  3. 답글 모두 감사합니다. 금일 동접 증가로 어제보다 동시접속이 많았음에도 surge큐는 일시적인 증가패턴밖에 보이지 않았습니다. 인스턴스의 문제는 없는것으로 추정되며 대략 패턴을 정리해 보면 ELB 프리워밍이 제대로 되지 않은 것 같습니다.관심가져주신 모든분들 감사합니다.^^

  4. 썸으로 보면 정상적인 합으로 보여집니다. 근데 AWS 메뉴얼에 보면 맥스값으로 보는것도 유의미한값이라고 써 있어서 고민했습니다. 프론트엔드서버 에서도 문제가 있을 수 있는데 실제 지표로 나온게 없어서 판단이 어려웠습니다. 다음에도 문제발생시 프론트엔드 문제는 배제하지 않고 같이 고민하겠습니다.

  5. surge queue가 증가한다는건 ELB에서 request를 받아서 아래로 보내는데 backend에서 response 처리가 계속 늦어지면 결국 밀려들어오는 요청을 잠시 큐에 쌓아두는 거구요…
    spill over까지 일어나지 않으면 실제 처리에는 손실은 발생하지 않습니다. spill over값도 한번 확인해보시구요… spill over까지 발생하면 조치가 필요한 상황입니다.
    간략히 말씀 드리면 윗분 말씀대로 WAS쪽 처리량 부족일 가능성이 굉장히 많습니다. 해당 시간때 WAS 쪽 모니터링값도 비교해보세요.
    WAS 처리량이 신속히 대응해 줄 수 있도록 하시면 됩니다. ^^

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.