FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1551, 254 aa 1>>>pF1KE1551 254 - 254 aa - 254 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6849+/-0.000856; mu= 11.8649+/- 0.051 mean_var=63.4768+/-12.978, 0's: 0 Z-trim(106.4): 54 B-trim: 262 in 1/52 Lambda= 0.160978 statistics sampled from 8912 (8966) to 8912 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.659), E-opt: 0.2 (0.275), width: 16 Scan time: 1.840 The best scores are: opt bits E(32554) CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 1489 354.4 4.3e-98 CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 1461 347.9 3.9e-96 CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 967 233.2 1.4e-61 CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 942 227.4 7.4e-60 CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 886 214.4 6.2e-56 CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 324 83.9 1.2e-16 CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 ( 227) 240 64.3 8.1e-11 CCDS4760.1 DMB gene_id:3109|Hs108|chr6 ( 263) 240 64.3 9.3e-11 >>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa) initn: 1479 init1: 1065 opt: 1489 Z-score: 1874.5 bits: 354.4 E(32554): 4.3e-98 Smith-Waterman score: 1489; 89.0% identity (93.7% similar) in 255 aa overlap (1-254:1-255) 10 20 30 40 50 60 pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV :::::::.::::::::::::::::::::::::: :::::: ::::::::::::::::::: CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DLGRKETVWCLPVLRQFR-FDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK :: ::::.: : . .: :::: :: :.:: ::::: .::: ::::::::::::::::: CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL ::::::::: :::::::::::::::::::::.::::::::::::::::::::::::::.: CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII :::.: :::::::::::.:::::::::::::::::::::::::::::::.:::::::::: CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 240 250 pF1KE1 RGLRSVGASRHQGPL .:::::::::::::: CCDS47 QGLRSVGASRHQGPL 250 >>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa) initn: 1460 init1: 1027 opt: 1461 Z-score: 1839.4 bits: 347.9 E(32554): 3.9e-96 Smith-Waterman score: 1461; 86.3% identity (94.5% similar) in 255 aa overlap (1-254:1-255) 10 20 30 40 50 60 pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV :::::::.:::::::.:::::::::::::::::::::.:::.::::::::::::::.::: CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DLGRKETVWCLPVLRQF-RFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK :: ::::: ::.. .: :::: :: :.:: ::.:. ....:::::::::::::::::: CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL :::::::: ::::::::::::::::::::::::::::::::::::::::::::::::.: CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII :::.: :::::::::::.::::::::::::::::::::.::::::::::.:::::::::: CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 240 250 pF1KE1 RGLRSVGASRHQGPL .:::::::::::: : CCDS47 QGLRSVGASRHQGLL 250 >>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa) initn: 896 init1: 781 opt: 967 Z-score: 1219.2 bits: 233.2 E(32554): 1.4e-61 Smith-Waterman score: 967; 58.0% identity (79.6% similar) in 255 aa overlap (1-254:7-260) 10 20 30 40 50 pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDG :. .:..: ::.:. ..: :. : ::::..:.. . :.. :.:.. ::: CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAA-FVQTHRPTGEFMFEFDE 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DEQFYVDLGRKETVWCLPVLRQ-FRFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPE ::.::::: .::::: : . : : :. : .:.:::.:..:::.::.::: : :::. :: CCDS47 DEMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 VTVFSKSPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKI :::: : :: ::::: ::: .:..::::.:.::: ::. :::::.:. :: ..:.:: :. CCDS47 VTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 SYLTLLPSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVV :::..::::. :::.:::::::.::::::: . : : : ::::.::::: .:::::.: CCDS47 HYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV 180 190 200 210 220 230 240 250 pF1KE1 GTVFIIRGLRSVGASRHQGPL :::.::..::: : :: : CCDS47 GTVLIIKSLRSGHDPRAQGTL 240 250 260 >>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa) initn: 962 init1: 717 opt: 942 Z-score: 1188.1 bits: 227.4 E(32554): 7.4e-60 Smith-Waterman score: 942; 58.3% identity (79.3% similar) in 242 aa overlap (1-241:1-242) 10 20 30 40 50 60 pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV : : .:.:: .: :..:: . :::..::: .::::: :::.::::: .. : : CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DLGRKETVWCLPVLRQF-RFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK :: ..:.:: :: . .: ::::: .:..::..: .:. :..::: . : : :.:::. : CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL : : :::::::::.::::::::.::::: ::..:::::..::: :. :: : :. :: .. CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII ::::. :::.::::::: :::.::: ..: : . ::.::::::..::::..::::.:: CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII 190 200 210 220 230 240 240 250 pF1KE1 RGLRSVGASRHQGPL : CCDS47 MGTYVSSVPR 250 >>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa) initn: 863 init1: 753 opt: 886 Z-score: 1117.7 bits: 214.4 E(32554): 6.2e-56 Smith-Waterman score: 886; 52.9% identity (76.9% similar) in 255 aa overlap (1-254:1-254) 10 20 30 40 50 60 pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV : .. . .:: . ....:: . : .:: ...: . ::.. .::::: :.: CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVI-IQAEFYLNPDQSGEFMFDFDGDEIFHV 10 20 30 40 50 70 80 90 100 110 pF1KE1 DLGRKETVWCLPVLRQF-RFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK :...::::: : . .: :. : ::.:::: : ::. . :::: : :: :::::... CCDS47 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL ::: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: .: CCDS47 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII ::.:. :::.:::::::.::::::: . :.:. : ::.:::::::.::::::..::.::: CCDS47 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII 180 190 200 210 220 230 240 250 pF1KE1 RGLRSVGASRHQGPL .:::. .:....::: CCDS47 KGLRKSNAAERRGPL 240 250 >>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa) initn: 276 init1: 135 opt: 324 Z-score: 412.1 bits: 83.9 E(32554): 1.2e-16 Smith-Waterman score: 324; 29.7% identity (59.3% similar) in 246 aa overlap (7-239:20-252) 10 20 30 40 pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQ :. . :. . .: .:. .:. . : :. .:: CCDS47 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDL-QNHTFLHTVYC-QDGSPSVG 10 20 30 40 50 50 60 70 80 90 pF1KE1 YTHEFDGDEQFYVDLGRKETVWCLPVLRQFR----------FDPQFALTNIAVLKHNLNS .. .: :. :. :.... : :: . .. :: .: : . .:.. CCDS47 LSEAYDEDQLFFFDFSQNTRVPRLPEFADWAQEQGDAPAILFDKEFCEWMIQQIGPKLDG 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE1 LIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPVVNITWLSNGHSV-TEG : : . : . ::. .:. .:.:: :.:.:.:.:::.....: . ::: .:: CCDS47 KIPVSRG------FPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNW--QHHSVPVEG 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE1 VSETSFLSKSDH-SFFKISYLTLLPSAEESYDCKVEHWGLDK-PLLKHWEPEIPAPMSEL . : :.: : :: .:::.. : . ..: : : .:. . .: :. : :.: CCDS47 FGPT-FVSAVDGLSFQAFSYLNFTPEPSDIFSCIVTHE-IDRYTAIAYWVPRNALP-SDL 180 190 200 210 220 220 230 240 250 pF1KE1 TETVVCALGLSVGLVGIVVGTVFIIRGLRSVGASRHQGPL :.:.:......:..::.:: :.:: CCDS47 LENVLCGVAFGLGVLGIIVGIVLIIYFRKPCSGD 230 240 250 260 >>CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 (227 aa) initn: 150 init1: 132 opt: 240 Z-score: 307.7 bits: 64.3 E(32554): 8.1e-11 Smith-Waterman score: 240; 26.7% identity (59.0% similar) in 161 aa overlap (54-214:73-226) 30 40 50 60 70 80 pF1KE1 EDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYVDLGRKETVWCLPVLRQFRFDPQF :. : ..:::. : ..: . . CCDS56 CYFTNGTERVRGVARYIYNREEYGRFDSDVGEFQAVTELGRSIEDWN--NYKDFLEQERA 50 60 70 80 90 100 90 100 110 120 130 140 pF1KE1 ALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPVVN :. .. .:: .. .. .: . : ::. . .:.. :.:.: : ...: .. CCDS56 AVDKVC--RHNYEAELR---TTLQRQVEPTVTISPSRTEALNHHNLLVCSVTDFYPAQIK 110 120 130 140 150 150 160 170 180 190 200 pF1KE1 ITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLLPSAEESYDCKVEHWGLDKPLLKHW . :. : . : :: ::.. ..: .: . .: . :. . : :.::: .:..:. .: CCDS56 VRWFRNDQEETAGVVSTSLIRNGDWTFQILVMLEITPQRGDIYTCQVEHPSLQSPITVEW 160 170 180 190 200 210 210 220 230 240 250 pF1KE1 EPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFIIRGLRSVGASRHQGPL .:. : : . : CCDS56 RPRGPPPAGLLH 220 >>CCDS4760.1 DMB gene_id:3109|Hs108|chr6 (263 aa) initn: 143 init1: 103 opt: 240 Z-score: 306.6 bits: 64.3 E(32554): 9.3e-11 Smith-Waterman score: 240; 33.3% identity (63.5% similar) in 126 aa overlap (112-236:115-238) 90 100 110 120 130 140 pF1KE1 QFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPV : : : . .: . .: .: : : ...: CCDS47 TLMQRLRNGLQNCATHTQPFWGSLTNRTRPPSVQVAKTTPFNTREPVMLACYVWGFYPAE 90 100 110 120 130 140 150 160 170 180 190 200 pF1KE1 VNITWLSNGHSVTEGVS-ETSFLSKSDHSFFKISYLTLLPSAEESYDCKVEHWGLDKPLL :.::: .::. : : . . ..: .. .:.:.: :: ..: : ::: : .:.: CCDS47 VTITWRKNGKLVMPHSSAHKTAQPNGDWTYQTLSHLALTPSYGDTYTCVVEHTGAPEPIL 150 160 170 180 190 200 210 220 230 240 250 pF1KE1 KHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFIIRGLRSVGASRHQGPL . : : . .::. : .. : :. :..::. . .:.. CCDS47 RDWTPGL-SPMQTL-KVSVSAVTLGLGLIIFSLGVISWRRAGHSSYTPLPGSNYSEGWHI 210 220 230 240 250 260 CCDS47 S 254 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 02:08:46 2016 done: Mon Nov 7 02:08:46 2016 Total Scan time: 1.840 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]