문제점 해결은 문제점 해결을 위해 시스템적으로 접근하는 방법입니다.
목적은 예상대로 작동하지 않는 원인을 판별하고 문제점 해결 방법을 모색하는 것입니다.
문제점 해결 프로세스의 맨 처음 단계는 문제점을 완벽하게 설명하는 것입니다.
문제점 설명이 없으면 사용자나 IBM®이 문제점의 원인을 찾기 위해
시작할 위치를 알 수 없습니다. 이 단계에는 다음과 같은 기본 질문이 포함되어 있습니다.
- 문제점의 증상은 무엇입니까?
- 문제점이 발생하는 위치는 어디입니까?
- 문제점이 발생하는 시기는 언제입니까?
- 어떤 상황에서 문제점이 발생합니까?
- 문제점을 재현할 수 있습니까?
이 일반적인 질문에 대한 답변을 통해 문제를 보다 잘 설명할 수 있습니다. 또한 이 방법이 문제점 해결을 시작하는 최상의 방법입니다.
문제점의 증상은 무엇입니까?
문제점을 설명할 때
"무엇이 문제인가"하는 질문으로 시작합니다.
이 질문은 직접적인 질문이기는 하지만 문제점을 보다 잘 연상시킬 수 있도록
몇 가지 초점에 맞추어 여러 질문으로 구분할 수 있습니다.
다음과 같은 질문이 포함될 수 있습니다.
- 누가(또는 무엇이) 문제점을 보고합니까?
- 오류 코드 및 메시지는 무엇입니까?
- 시스템이 어떻게 실패합니까? (예: 루프 상태, 정지 상태, 충돌 상태, 성능 하락 또는 잘못된 결과)
- 문제점이 비즈니스에 미치는 영향은 무엇입니까?
문제점이 발생하는 위치는 어디입니까?
문제점의 시발점을 판단하는 것이
항상 쉬운 것만은 아니지만 이는 문제점을 해결하는 데 매우 중요한 단계 중 하나입니다.
많은 기술적 레이어가 보고된 컴포넌트와 보고되지 않은 컴포넌트 사이에 있을 수 있습니다.
네트워크, 디스크 및 드라이버 등이 문제점을 조사할 때 고려될 수 있는 컴포넌트입니다.
다음 질문은 문제점이 발생한 위치에 초점을 두어 문제점 레이어를 구분할 수 있게 도와줍니다.
- 문제점이 특정 플랫폼 또는 운영 체제에서만 발생합니까? 아니면 여러 플랫폼 또는 운영 체제에서 공통적으로 발생합니까?
- 현재 환경 및 구성이 지원됩니까?
한 레이어에서 문제점을 보고한 경우 반드시 그 레이어에서 문제점이 발생한 것은 아님을 유념하십시오.
문제점이 발생한 위치 식별 시 문제점이 발생했던 환경을 이해하는 과정이 포함됩니다.
운영 체제 및 버전, 해당되는 모든 소프트웨어 및 버전과 하드웨어 정보를 포함한,
문제점 환경을 최대한 완벽하게 설명해야 합니다.
지원되는 구성 내의 환경에서 실행 중인지 확인하십시오.
여러 문제점을 추적해 보면 제대로 테스트될 수 없거나 함께 실행될 수 없는, 호환되지 않는 소프트웨어 레벨로 인한 것입니다.
문제점이 발생하는 시기는 언제입니까?
실패 이벤트의 자세한 타임라인 작성 시 특히 일회성 이벤트에 중점을 두어 작성하십시오.
이 작업은 이전으로 되돌아가 작업할 경우 가장 쉽게 수행할 수 있습니다. 사용 가능한 로그 및 정보를 활용하여 가능한 한 밀리초 단위로 정확하게 오류가 보고된 시간에 작업을 시작하십시오.
일반적으로 진단 로그에서 발견되는
최초로 의심되는 이벤트까지만 찾으면 됩니다. 그러나 이를 수행하는 것이
언제나 쉽지는 않기 때문에 연습이 필요합니다. 여러 레이어의 기술이
관련되어 있을 경우와 각각 자체 진단 정보를 가지고 있을 경우에는
찾기를 중단할 시기를 아는 것이 특히 어렵습니다.
이벤트의 자세한 타임라인을 작성하려면 다음 질문에 응답하십시오.
- 낮 또는 밤의 특정 시간에만 문제점이 발생합니까?
- 문제점이 얼마나 자주 발생합니까?
- 문제점 보고 시점까지 이벤트가 어떤 순서로 발생합니까?
- 소프트웨어나 하드웨어의 설치 또는 업그레이드와 같은 환경 변화 이후에 문제점이 발생합니까?
이와 같은 유형의 질문에 응답하면 문제점을 조사하는 참조 프레임을 제공하는 데
도움이 됩니다.
어떤 상황에서 문제점이 발생합니까?
문제점이 발생하는 시간에
실행 중이던 기타 시스템 및 응용프로그램을 확인하는 것이
문제점 해결에서 중요합니다. 환경에 대한 다음 질문과 기타 질문은 문제점의 근본 원인을 식별하는 데
도움이 됩니다.
- 동일한 타스크가 수행 중이면 문제점이 항상 발생합니까?
- 일련의 특정 이벤트가 발생해야 문제점이 발생합니까?
- 다른 응용프로그램이 동시에 실패합니까?
이러한 유형의 질문에 응답하면 문제점이 발생하는 환경에 대해 설명하고
종속성을 상관시키는 데 도움이 됩니다. 동일한 시간대에 여러 문제점이 발생했더라도
이들 문제점이 반드시 관련되어 있지는 않음을 기억하십시오.
문제점을 재현할 수 있습니까?
문제점 해결의 관점에서 "이상적"인 문제점은 재현할 수 있는
문제점입니다. 일반적으로 재현할 수 있는 문제점에 대해서는 조사 시
사용자가 사용할 수 있는 프로시저 또는 도구 세트가 아주 많습니다. 즉,
재현할 수 있는 문제점은 보다 쉽게 디버그하고 해결할 수
있는 경우가 많습니다. 그러나 재현할 수 있는 문제점에도 단점이 있습니다.
문제점이 비즈니스에 상당한 영향을 미칠 경우에는 이 문제점을 재현하기 어려울 수도 있습니다.
가능한 경우 조사 중에 일반적으로 보다 나은 유연성 및 제어를 제공하는 테스트 또는
개발 환경에서 문제점을 다시 작성하십시오.
팁: 의심이 가는 컴포넌트로 문제점을
분리하도록 시나리오를 단순화하십시오.
문제점을 재현하는 데 도움이 되는 질문은 다음과 같습니다.
- 테스트 시스템에서 문제점을 다시 재현할 수 있습니까?
- 여러 사용자 또는 응용프로그램에 동일한 유형의 문제점이 발생합니까?
- 단일 명령, 일련의 명령, 특정 응용프로그램 또는 독립형 응용프로그램을
실행하여 문제점을 다시 재현할 수 있습니까?