FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1515, 260 aa 1>>>pF1KE1515 260 - 260 aa - 260 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4301+/-0.000861; mu= 13.9259+/- 0.052 mean_var=71.7575+/-14.004, 0's: 0 Z-trim(106.9): 63 B-trim: 19 in 1/50 Lambda= 0.151405 statistics sampled from 9216 (9280) to 9216 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.678), E-opt: 0.2 (0.285), width: 16 Scan time: 2.170 The best scores are: opt bits E(32554) CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 1714 383.4 8.2e-107 CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 1022 232.3 2.6e-61 CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 979 222.9 1.7e-58 CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 958 218.3 4.2e-57 CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 938 213.9 8.4e-56 CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 361 87.9 7.6e-18 CCDS4765.1 DPB1 gene_id:3115|Hs108|chr6 ( 258) 289 72.2 4.1e-13 CCDS78128.1 DQB2 gene_id:3120|Hs108|chr6 ( 264) 268 67.6 1e-11 CCDS59006.1 DQB1 gene_id:3119|Hs108|chr6 ( 269) 258 65.4 4.6e-11 >>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa) initn: 1755 init1: 1714 opt: 1714 Z-score: 2031.1 bits: 383.4 E(32554): 8.2e-107 Smith-Waterman score: 1714; 97.3% identity (98.8% similar) in 260 aa overlap (1-260:1-260) 10 20 30 40 50 60 pF1KE1 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDED 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 EQFYVDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDPPEV :.::::::::::::::::::.::::::::::::::::::::::::::::::::.:::::: CCDS47 EMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPEV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 TVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHKFH :::::::::::::::::::::.::::::::::::::: :::::::::::::::::::::: CCDS47 TVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKFH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 YLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIVG :::::::::: ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 YLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIVG 190 200 210 220 230 240 250 260 pF1KE1 TVLIIKSLRSGHDPRAQGPL :::::::::::::::::: : CCDS47 TVLIIKSLRSGHDPRAQGTL 250 260 >>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa) initn: 1008 init1: 1008 opt: 1022 Z-score: 1214.3 bits: 232.3 E(32554): 2.6e-61 Smith-Waterman score: 1022; 60.7% identity (81.4% similar) in 247 aa overlap (14-260:8-254) 10 20 30 40 50 60 pF1KE1 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDED .: . .: :.: . . ::: .:: : : . .:::::.:: : CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGD 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 EQFYVDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDPPEV : :.::. ::::::.:::::: ::::::.:::::. . ::. . .:::.: .: :::: CCDS47 EIFHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 TVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHKFH ::. . :::: .::.::: ::.: :::.::::: ::.::: ::.:..:::: :. :.::: CCDS47 TVLTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFH 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 YLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIVG :: :.::.::::::::::::::.::::::: . : .:::::.:.:::::..::::::.: CCDS47 YLPFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIG 180 190 200 210 220 230 250 260 pF1KE1 TVLIIKSLRSGHDPRAQGPL :..:::.::... . .::: CCDS47 TIFIIKGLRKSNAAERRGPL 240 250 >>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa) initn: 966 init1: 929 opt: 979 Z-score: 1163.5 bits: 222.9 E(32554): 1.7e-58 Smith-Waterman score: 979; 56.5% identity (79.6% similar) in 255 aa overlap (7-260:1-255) 10 20 30 40 50 pF1KE1 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAA-FVQTHRPTGEFMFEFDE :. .:..: ::.:. ..: :. : ::::.. .. . : . :.:.. ::: CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDG 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DEQFYVDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDPPE ::::::::..:::.:. ::.. .:. ::.: :.:. ..::: .:.: : : :.:. :: CCDS47 DEQFYVDLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 VTVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHKF :::: : :: ::::::::: .: .::::.:.::: ::. :::::.:. :: ..:.:: :. CCDS47 VTVFSKSPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 HYLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV ::::.:::...:::.::::::::::::::: . : : : ::::.::::: .::.::.: CCDS47 SYLTFLPSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVV 180 190 200 210 220 230 240 250 260 pF1KE1 GTVLIIKSLRSGHDPRAQGPL :::.::..::: : :::: CCDS47 GTVFIIQGLRSVGASRHQGPL 240 250 >>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa) initn: 921 init1: 851 opt: 958 Z-score: 1138.7 bits: 218.3 E(32554): 4.2e-57 Smith-Waterman score: 958; 55.3% identity (80.4% similar) in 255 aa overlap (7-260:1-255) 10 20 30 40 50 pF1KE1 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAA-FVQTHRPTGEFMFEFDE :. .:..: ::.:. ..: :. : ::::..:.. : :.: :.:.. ::: CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDG 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DEQFYVDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDPPE ::.:::::. :::::.: :.. .::. :..: :.:. ...:. ....:: : :.:. :: CCDS47 DEEFYVDLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 VTVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHKF :::: : :: ::::::::: .: .::::.:.::: ::. :::::.:. :: ..:.:: :. CCDS47 VTVFSKFPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKI 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 HYLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV ::::.:::...:::.:::::::.::::::: . : : : :::..::::: .::.::.: CCDS47 SYLTFLPSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVV 180 190 200 210 220 230 240 250 260 pF1KE1 GTVLIIKSLRSGHDPRAQGPL :::.::..::: : :: : CCDS47 GTVFIIQGLRSVGASRHQGLL 240 250 >>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa) initn: 933 init1: 877 opt: 938 Z-score: 1115.3 bits: 213.9 E(32554): 8.4e-56 Smith-Waterman score: 938; 56.9% identity (78.2% similar) in 248 aa overlap (10-255:3-250) 10 20 30 40 50 pF1KE1 MRPEDRMFHIRA-VILRALSLAFLLSLRGAGAIKADHVSTYA-AFVQTHRPTGEFMFEFD .:: ..: .: ::: . ::: ::::...:. :: :.. .:.: ::: CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFD 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 EDEQFYVDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDPP :.. : ::: :.:.::.: ::: :. :::::.:: .. .:. :..:::...: : :: CCDS47 EEQLFSVDLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 EVTVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHK .:::.:: ::::::: ::: .: .::::.:.::: ::. ::::::.. : . :. :.: CCDS47 RVTVLPKSRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 FHYLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGII :::: :::::::::::.::::::: :::.::: : :: :.. ::..:::::..::::.. CCDS47 FHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFL 180 190 200 210 220 230 240 250 260 pF1KE1 VGTVLIIKSLRSGHDPRAQGPL ::::::: . . :: CCDS47 VGTVLIIMGTYVSSVPR 240 250 >>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa) initn: 353 init1: 147 opt: 361 Z-score: 433.8 bits: 87.9 E(32554): 7.6e-18 Smith-Waterman score: 361; 31.0% identity (59.7% similar) in 216 aa overlap (35-245:41-252) 10 20 30 40 50 60 pF1KE1 DRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDEDEQFY .:. .... : :. . .:::. :. CCDS47 LLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFF 20 30 40 50 60 70 70 80 90 100 110 pF1KE1 VDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDP-----PE :.... : .: :: : . :: : . .. . .::. . .. : : CCDS47 FDFSQNTRVPRLPEF--ADWAQEQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPI 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 VTVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHKF . :: .:.:.:.::::.: .. .:::.:.:.: .. :: :: . .. ::. : CCDS47 AEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPV-EGFGPTFVSAVDGLSFQAF 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 HYLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV ::.:.: :...: : : . .: .. . . :.:::.... ::..:::: CCDS47 SYLNFTPEPSDIFSCIVTHEIDRYTAIAYWVPRNALP-SDLLENVLCGVAFGLGVLGIIV 190 200 210 220 230 240 240 250 260 pF1KE1 GTVLIIKSLRSGHDPRAQGPL : :::: CCDS47 GIVLIIYFRKPCSGD 250 260 >>CCDS4765.1 DPB1 gene_id:3115|Hs108|chr6 (258 aa) initn: 250 init1: 228 opt: 289 Z-score: 348.9 bits: 72.2 E(32554): 4.1e-13 Smith-Waterman score: 289; 28.0% identity (55.6% similar) in 243 aa overlap (11-243:11-246) 10 20 30 40 50 pF1KE1 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHV----STYAAFVQTHRPTGEFMFE :.: : :: ...: :. . : ... . :: :.: ..... CCDS47 MMVLQVSAAPRTVALTALLMVLLTSVVQGRATPENYLFQGRQECYAFNGTQRFLERYIYN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 FDEDEQFYVDLDKKETVWHLEEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNH------ .: .: :. . ..: :.:: . : .. .: . . . : :. CCDS47 REEFARFDSDVGEFRAV---TELGRP-AAEYWNSQKDILEEKRAVPDRMCRHNYELGGPM 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 TQAANDPPEVTVFPKEPVELGQPNTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLP : :.:.: :.. : . : :.::. :.: ..: :. ::. : ::. . .. CCDS47 TLQRRVQPRVNVSPSKKGPLQHHNLLVCHVTDFYPGSIQVRWFLNGQEETAGVVSTNLIR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 RTDYSFHKFHYLTFVPSAEDVYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGL :..:. . .: ..:. ::: :.::: .::.:. .:.:: ..:. : :. CCDS47 NGDWTFQILVMLEMTPQQGDVYTCQVEHTSLDSPVTVEWKAQSD---SARSKTLTGAGGF 180 190 200 210 220 230 240 250 260 pF1KE1 VLGLVGIIVGTVLIIKSLRSGHDPRAQGPL ::::. :: . CCDS47 VLGLIICGVGIFMHRRSKKVQRGSA 240 250 >>CCDS78128.1 DQB2 gene_id:3120|Hs108|chr6 (264 aa) initn: 111 init1: 90 opt: 268 Z-score: 324.0 bits: 67.6 E(32554): 1e-11 Smith-Waterman score: 268; 27.1% identity (60.6% similar) in 218 aa overlap (48-259:53-259) 20 30 40 50 60 70 pF1KE1 LSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDEDEQFYVDLDKKETVWHL- : ....... .: .: :. . ..: .: CCDS78 TPVAEARDFPKDFLVQFKGMCYFTNGTERVRGVARYIYNREEYGRFDSDVGEFQAVTELG 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE1 ---EEFGRAFSFEAQGGLANIAILNNNLNTLIQRSNHTQAANDPPEVTVFPKEPVELGQP :... .: : : . .: .. .. . . :. : ::. :.. :.. CCDS78 RSIEDWNNYKDFLEQERAAVDKVCRHNYEAELRTTLQRQV---EPTVTISPSRTEALNHH 90 100 110 120 130 140 150 160 170 180 190 pF1KE1 NTLICHIDRFFPPVLNVTWLCNGEPVTEGVAESLFLPRTDYSFHKFHYLTFVPSAEDVYD : :.: . :.: ..: :. : . : ::. . .. :..:. . .: ..:. :.: CCDS78 NLLVCSVTDFYPAQIKVRWFRNDQEETAGVVSTSLIRNGDWTFQILVMLEITPQRGDIYT 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE1 CRVEHWGLDQPLLKHWEAQEPIQMPETTET-VLCALG-LVLGLVGIIVGTVLIIKSLRSG :.::: .:..:. .:.:: :.... .: ..: .:::: :..: :::. :. CCDS78 CQVEHPSLQSPITVEWRAQS-----ESAQSKMLSGIGGFVLGL--IFLGLGLIIRH-RGQ 200 210 220 230 240 250 260 pF1KE1 HDPRAQGPL . ::. : CCDS78 KGPRGPPPAGLLH 260 >>CCDS59006.1 DQB1 gene_id:3119|Hs108|chr6 (269 aa) initn: 168 init1: 147 opt: 258 Z-score: 312.1 bits: 65.4 E(32554): 4.6e-11 Smith-Waterman score: 258; 35.0% identity (63.6% similar) in 143 aa overlap (118-259:129-262) 90 100 110 120 130 140 pF1KE1 QGGLANIAILNNNLNTLIQRSNHTQAANDPPEVTVFPKEPVELGQPNTLICHIDRFFPPV : ::. :.. :.. : :.: . :.: CCDS59 VLEGTRAELDTVCRHNYEVAFRGILQRRVEPTVTISPSRTEALNHHNLLVCSVTDFYPGQ 100 110 120 130 140 150 150 160 170 180 190 200 pF1KE1 LNVTWLCNGEPVTEGVAESLFLPRTDYSFHKFHYLTFVPSAEDVYDCRVEHWGLDQPLLK ..: :. : . : ::. . .. :..:. . .: ..:. ::: :.::: .:..:. CCDS59 IKVRWFRNDQEETAGVVSTPLIRNGDWTFQILVMLEMTPQRGDVYTCHVEHPSLQSPITV 160 170 180 190 200 210 210 220 230 240 250 260 pF1KE1 HWEAQ-EPIQMPETTETVLCALGLVLGLVGIIVGTVLIIKSLRSGHDPRAQGPL .:.:: : : .. . . :.:::: :..: :::.. :: . : ::: CCDS59 EWRAQSESAQ----SKMLSGVGGFVLGL--IFLGLGLIIRQ-RSQKGP--QGPPPAGLLH 220 230 240 250 260 260 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 01:59:43 2016 done: Mon Nov 7 01:59:43 2016 Total Scan time: 2.170 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]