| 번호 | 청구항 |
|---|---|
| 1 | 리드(read)를 콘티그(contig)에 정렬하기 위해 각 콘티그를 4xN 혹은 Nx4인 컨센서스 행렬 C과 이에 상응한 길이 N인 대표 시퀀스 s로 표현하고,컨센서스 행렬 C를 취하고 로 주어지는 대표 시퀀스를 반환하는 함수 rep(・)를 정의하고, 여기서, s의 각 요소는 에 의해 주어지고,시퀀스 s를 취하여 s에 의해 초기화된 컨센서스 행렬을 반환하는함수 cns(・)를 정의하고, 의 각 행 혹은 열은 해당 콘티그의 해당 위치에서의 정렬된 리드(read)로부터 획득된 값으로 해당 위치에서 해당 염기가 몇 번 발생했는지를 나타내는 염기의 발생 회수일 수 있고, 의 각 요소는에 의해 주어지고,길이 m의 리드(read) r이 s의 좌/우에서 길이 l ≥ m의 대표 시퀀스 와 부분적으로 중첩되고 중첩 깊이가 라고 가정하여,으로 컨센서스 행렬 C와 대표 시퀀스 s의 쌍으로 주어지는 콘티그 프로파일을 업데이트하고,여기서, N은 4xN 혹은 Nx4인 컨센서스 행렬 C에 상응하는 대표 시퀀스 s의 길이이고, l은 콘티그의 길이, Oth는 n이 유효 값이기 위한 최소 중첩 깊이인 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 프로파일의 업데이트 방법. |
| 2 | 제 1 항에 있어서, 길이 m의 리드(read) r이 길이 l ≥ m의 대표 시퀀스 의 위치 a에서 완전히 중첩되는 것으로 가정하고,콘티그 프로파일을으로 업데이트 하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 프로파일의 업데이트 방법. |
| 3 | 제 1 항 또는 제 2 항에 있어서, 각각 길이 l과 m의 두 시퀀스 s와 리드(read) r의 정렬 테스트시에 s에 대해 r을 정렬할 때 (1)완전한 중첩, (2)참조 시퀀스의 왼쪽 또는 오른쪽에서의 부분 중첩, (3)중첩 없음의 3가지의 경우를 고려하고,구간 의 어떤 정수 a에 대하여 중첩구간 내에서 두 시퀀스간의 해밍거리 이 미리 정해진 거리 문턱값 에 대해 을 만족하면 r은 s와 완전히 중첩하는 것이고, 조건들 에서 하나를 만족하는 정수 n이 존재할 때, r은 깊이 n에서 s와 부분적으로 겹치는 것이고, 조건을 만족하는 n이 여러 개 존재하면 가장 큰 값을 선택하고,여기서, 는 거리 문턱값이며 는 두 벡터 a와 b 사이의 해밍 거리이고, n은 유효 중첩 깊이로 간주되는 최소 중첩 깊이 에 대해 을 만족하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 프로파일의 업데이트 방법. |
| 4 | 제 3 항에 있어서, 거리 문턱값()와, 최소 중첩 깊이()는 미리 정의되는 값이거나, 콘티그 성장 단계에서의 콘티그 성장에 따라 적응적으로 변화되는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 프로파일의 업데이트 방법. |
| 5 | 제 1 항에 있어서, 길이 l의 콘티그 대표 시퀀스 s는 4xN 또는 Nx4인 컨센서스 행렬 C를 수반하고, 컨센서스 행렬 C의 각 행 또는 각 열은 염기 {A, C, G, T}에 해당하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 프로파일의 업데이트 방법. |
| 6 | 리드(read)를 콘티그(contig)에 정렬하기 위해 각 콘티그를 4xN 혹은 Nx4인 컨센서스 행렬 C과 이에 상응한 길이 N인 대표 시퀀스 s로 표현하여,리드(read)의 집합으로부터 리드(read)를 선택하고 지금까지 발견된 콘티그의 집합의 모든 콘티그들과의 정렬을 시도할때 상기의 컨센서스 행렬을 사용하는 콘티그 성장 단계;상기 콘티그 성장 단계에서 얻어진 컨센서스 행렬 C와 대표 시퀀스 s의 쌍으로 주어지는 콘티그 프로파일을 이용한 접합부 탐색을 통해 염기 서열의 세그먼트를 나타내는 노드와 세그먼트 사이의 연결을 나타내는 에지를 구성하는 그래프 구성 단계;상기 그래프로부터 동형전사체(isoform)를 검출하고 발현량(abundances)을 추정하는 결합 검출/추정 단계;를 포함하고,콘티그 성장 단계에서, 컨센서스 행렬 C를 취하고 로 주어지는 대표 시퀀스를 반환하는 함수 rep(・)를 정의하고, 여기서, s의 각 요소는 에 의해 주어지고,시퀀스 s를 취하여 s에 의해 초기화된 컨센서스 행렬을 반환하는 함수 cns(・)를 정의하고, 의 각 행 혹은 열은 해당 콘티그의 해당 위치에서의 정렬된 리드(read)로부터 획득된 값으로 해당 위치에서 해당 염기가 몇 번 발생했는지를 나타내는 염기의 발생 회수일 수 있고, 의 각 요소는에 의해 주어지고,길이 m의 리드(read) r이 s의 좌/우에서 길이 l ≥ m의 대표 시퀀스 와 부분적으로 중첩되고 중첩 깊이가 라고 가정하여,으로 컨센서스 행렬 C와 대표 시퀀스 s의 쌍으로 주어지는 콘티그 프로파일을 업데이트하고,여기서, N은 4xN 혹은 Nx4인 컨센서스 행렬 C에 상응하는 대표 시퀀스 s의 길이이고, l은 콘티그의 길이, Oth는 n이 유효 값이기 위한 최소 중첩 깊이인 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |
| 7 | 제 6 항에 있어서, 콘티그 성장 단계에서,선택된 리드(read)와 가장 많이 중첩되는 콘티그를 선택하고 리드(read)와 콘티그가 완전하게 중첩하면 콘티그에 리드(read)를 결합(merge)하고, 리드(read)와 부분적으로만 중첩되면 콘티그를 연장하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |
| 8 | 제 6 항에 있어서, 하나의 리드(read)와 두 개 혹은 그 이상의 콘티그와 중첩을 갖는 경우 중첩이 더 큰 콘티그에 결합하는 greedy 방식이 적용되고,미리 정의된 값보다 크거나 같은 중첩을 갖는 콘티그가 없다면 리드(read)를 콘티그 풀에 추가하고, 이 과정들은 모든 리드(read)들이 처리될 때까지 반복하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |
| 9 | 삭제 |
| 10 | 제 6 항에 있어서, 길이 m의 리드(read) r이 길이 l ≥ m의 대표 시퀀스 의 위치 a에서 완전히 중첩되는 것으로 가정하고,콘티그 프로파일을으로 업데이트 하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |
| 11 | 제 6 항 또는 제 10 항에 있어서, 길이 l의 콘티그 대표 시퀀스 s는 4xN 또는 Nx4인 컨센서스 행렬 C를 수반하고, 컨센서스 행렬 C의 각 행 또는 각 열은 염기 {A, C, G, T}에 해당하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |
| 12 | DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성을 위하여,리드(read)를 콘티그(contig)에 정렬하기 위해 각 콘티그를 4xN 혹은 Nx4인 컨센서스 행렬 C과 이에 상응한 길이 N인 대표 시퀀스 s로 표현하는 단계;리드(read)의 집합으로부터 리드(read)를 선택하고 지금까지 발견된 콘티그의 집합의 모든 콘티그들과의 정렬을 시도하는 단계;선택된 리드(read)와 가장 많이 중첩되는 콘티그를 선택하고 리드(read)와 콘티그가 완전하게 중첩하면 콘티그에 리드(read)를 결합(merge)하고, 리드(read)와 부분적으로만 중첩되면 콘티그를 연장하는 단계;하나의 리드(read)가 두 개 혹은 그 이상의 콘티그와 중첩을 갖는 경우 중첩이 더 큰 콘티그에 결합하는 단계;미리 정의된 값보다 크거나 같은 중첩을 갖는 콘티그가 없다면 리드(read)를 콘티그 풀에 추가하는 단계;를 포함하고,콘티그 형성을 위하여, 컨센서스 행렬 C를 취하고 로 주어지는 대표 시퀀스를 반환하는 함수 rep(・)를 정의하고, 여기서, s의 각 요소는 에 의해 주어지고,시퀀스 s를 취하여 s에 의해 초기화된 컨센서스 행렬을 반환하는 함수 cns(・)를 정의하고, 의 각 행 혹은 열은 해당 콘티그의 해당 위치에서의 정렬된 리드(read)로부터 획득된 값으로 해당 위치에서 해당 염기가 몇 번 발생했는지를 나타내는 염기의 발생 회수일 수 있고, 의 각 요소는에 의해 주어지고,길이 m의 리드(read) r이 s의 좌/우에서 길이 l ≥ m의 대표 시퀀스 와 부분적으로 중첩되고 중첩 깊이가 라고 가정하여,으로 컨센서스 행렬 C와 대표 시퀀스 s의 쌍으로 주어지는 콘티그 프로파일을 업데이트하고,여기서, N은 4xN 혹은 Nx4인 컨센서스 행렬 C에 상응하는 대표 시퀀스 s의 길이이고, l은 콘티그의 길이, Oth는 n이 유효 값이기 위한 최소 중첩 깊이인 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |
| 13 | 삭제 |
| 14 | 제 12 항에 있어서, 길이 m의 리드(read) r이 길이 l ≥ m의 대표 시퀀스 의 위치 a에서 완전히 중첩되는 것으로 가정하고,콘티그 프로파일을으로 업데이트 하는 것을 특징으로 하는 DNA 샷건 시퀀싱 또는 RNA 전사체 어셈블리를 위한 콘티그 형성 방법. |