FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1508, 142 aa 1>>>pF1KE1508 142 - 142 aa - 142 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3641+/-0.000768; mu= 10.4093+/- 0.046 mean_var=52.1097+/-10.301, 0's: 0 Z-trim(106.1): 16 B-trim: 0 in 0/53 Lambda= 0.177670 statistics sampled from 8803 (8816) to 8803 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.665), E-opt: 0.2 (0.271), width: 16 Scan time: 1.720 The best scores are: opt bits E(32554) CCDS10397.1 HBZ gene_id:3050|Hs108|chr16 ( 142) 909 240.5 2.6e-64 CCDS10398.1 HBA2 gene_id:3040|Hs108|chr16 ( 142) 563 151.8 1.3e-37 CCDS10399.1 HBA1 gene_id:3039|Hs108|chr16 ( 142) 563 151.8 1.3e-37 CCDS10400.1 HBQ1 gene_id:3049|Hs108|chr16 ( 142) 485 131.9 1.3e-31 CCDS32347.1 HBM gene_id:3042|Hs108|chr16 ( 141) 436 119.3 8e-28 CCDS7755.1 HBG2 gene_id:3048|Hs108|chr11 ( 147) 362 100.3 4.3e-22 CCDS7754.1 HBG1 gene_id:3047|Hs108|chr11 ( 147) 362 100.3 4.3e-22 CCDS7756.1 HBE1 gene_id:3046|Hs108|chr11 ( 147) 357 99.0 1e-21 CCDS31376.1 HBD gene_id:3045|Hs108|chr11 ( 147) 330 92.1 1.3e-19 CCDS7753.1 HBB gene_id:3043|Hs108|chr11 ( 147) 321 89.8 6.2e-19 CCDS13917.1 MB gene_id:4151|Hs108|chr22 ( 154) 230 66.5 6.8e-12 >>CCDS10397.1 HBZ gene_id:3050|Hs108|chr16 (142 aa) initn: 909 init1: 909 opt: 909 Z-score: 1268.2 bits: 240.5 E(32554): 2.6e-64 Smith-Waterman score: 909; 100.0% identity (100.0% similar) in 142 aa overlap (1-142:1-142) 10 20 30 40 50 60 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHFDLHPGSAQLRAHG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHFDLHPGSAQLRAHG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAARFPADFTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAARFPADFTA 70 80 90 100 110 120 130 140 pF1KE1 EAHAAWDKFLSVVSSVLTEKYR :::::::::::::::::::::: CCDS10 EAHAAWDKFLSVVSSVLTEKYR 130 140 >>CCDS10398.1 HBA2 gene_id:3040|Hs108|chr16 (142 aa) initn: 563 init1: 563 opt: 563 Z-score: 788.9 bits: 151.8 E(32554): 1.3e-37 Smith-Waterman score: 563; 59.9% identity (83.1% similar) in 142 aa overlap (1-142:1-142) 10 20 30 40 50 60 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHFDLHPGSAQLRAHG : :. ...: . . :.:....: :.:.:::.::: : :::::::::: ::::...:: CCDS10 MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAARFPADFTA .::. :. .:: .::. .::: ::.:::. :::::::::::::::::::::..::.:: CCDS10 KKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTP 70 80 90 100 110 120 130 140 pF1KE1 EAHAAWDKFLSVVSSVLTEKYR .::. ::::. ::.::: ::: CCDS10 AVHASLDKFLASVSTVLTSKYR 130 140 >>CCDS10399.1 HBA1 gene_id:3039|Hs108|chr16 (142 aa) initn: 563 init1: 563 opt: 563 Z-score: 788.9 bits: 151.8 E(32554): 1.3e-37 Smith-Waterman score: 563; 59.9% identity (83.1% similar) in 142 aa overlap (1-142:1-142) 10 20 30 40 50 60 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHFDLHPGSAQLRAHG : :. ...: . . :.:....: :.:.:::.::: : :::::::::: ::::...:: CCDS10 MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAARFPADFTA .::. :. .:: .::. .::: ::.:::. :::::::::::::::::::::..::.:: CCDS10 KKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTP 70 80 90 100 110 120 130 140 pF1KE1 EAHAAWDKFLSVVSSVLTEKYR .::. ::::. ::.::: ::: CCDS10 AVHASLDKFLASVSTVLTSKYR 130 140 >>CCDS10400.1 HBQ1 gene_id:3049|Hs108|chr16 (142 aa) initn: 485 init1: 485 opt: 485 Z-score: 680.8 bits: 131.9 E(32554): 1.3e-31 Smith-Waterman score: 485; 52.1% identity (80.3% similar) in 142 aa overlap (1-142:1-142) 10 20 30 40 50 60 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHFDLHPGSAQLRAHG :.:. .:... ..: :..... . ::.::: ::. : ::::: :.:: :::.:.:::: CCDS10 MALSAEDRALVRALWKKLGSNVGVYTTEALERTFLAFPATKTYFSHLDLSPGSSQVRAHG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAARFPADFTA .::. :.. ::. .::. ::: ::.::: :::::..:.::.:::::::: ..:.::. CCDS10 QKVADALSLAVERLDDLPHALSALSHLHACQLRVDPASFQLLGHCLLVTLARHYPGDFSP 70 80 90 100 110 120 130 140 pF1KE1 EAHAAWDKFLSVVSSVLTEKYR .:. ::::: : :.:. .:: CCDS10 ALQASLDKFLSHVISALVSEYR 130 140 >>CCDS32347.1 HBM gene_id:3042|Hs108|chr16 (141 aa) initn: 436 init1: 436 opt: 436 Z-score: 613.0 bits: 119.3 E(32554): 8e-28 Smith-Waterman score: 436; 47.9% identity (77.9% similar) in 140 aa overlap (3-142:2-141) 10 20 30 40 50 60 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHFDLHPGSAQLRAHG :. ::. :...: :. . .:.: : ::: .:.::.::::.. ..:: .:: CCDS32 MLSAQERAQIAQVWDLIAGHEAQFGAELLLRLFTVYPSTKVYFPHLSACQDATQLLSHG 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 SKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAARFPADFTA ....:::: ::. .:.. .::: :..::: .:::::.:: :: .:. :.::... .::. CCDS32 QRMLAAVGAAVQHVDNLRAALSPLADLHALVLRVDPANFPLLIQCFHVVLASHLQDEFTV 60 70 80 90 100 110 130 140 pF1KE1 EAHAAWDKFLSVVSSVLTEKYR . .:::::::. :. ::::::: CCDS32 QMQAAWDKFLTGVAVVLTEKYR 120 130 140 >>CCDS7755.1 HBG2 gene_id:3048|Hs108|chr11 (147 aa) initn: 324 init1: 272 opt: 362 Z-score: 510.2 bits: 100.3 E(32554): 4.3e-22 Smith-Waterman score: 362; 40.0% identity (76.6% similar) in 145 aa overlap (3-141:4-146) 10 20 30 40 50 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHF-DLHPGSA---- .:. ... :.:.:.:.... : ::: ::.. .: :. .: : .: .:: CCDS77 MGHFTEEDKATITSLWGKVNVE--DAGGETLGRLLVVYPWTQRFFDSFGNLSSASAIMGN 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 -QLRAHGSKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAAR ...:::.::....:::.: .::. :....::::: :.::: :::::.. :...:: . CCDS77 PKVKAHGKKVLTSLGDAIKHLDDLKGTFAQLSELHCDKLHVDPENFKLLGNVLVTVLAIH 60 70 80 90 100 110 120 130 140 pF1KE1 FPADFTAEAHAAWDKFLSVVSSVLTEKYR : .:: :..:.:.:... :.:.:. .: CCDS77 FGKEFTPEVQASWQKMVTGVASALSSRYH 120 130 140 >>CCDS7754.1 HBG1 gene_id:3047|Hs108|chr11 (147 aa) initn: 324 init1: 272 opt: 362 Z-score: 510.2 bits: 100.3 E(32554): 4.3e-22 Smith-Waterman score: 362; 40.0% identity (77.2% similar) in 145 aa overlap (3-141:4-146) 10 20 30 40 50 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHF-DLHPGSA---- .:. ... :.:.:.:.... : ::: ::.. .: :. .: : .: .:: CCDS77 MGHFTEEDKATITSLWGKVNVE--DAGGETLGRLLVVYPWTQRFFDSFGNLSSASAIMGN 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 -QLRAHGSKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAAR ...:::.::....:::.: .::. :....::::: :.::: :::::.. :...:: . CCDS77 PKVKAHGKKVLTSLGDATKHLDDLKGTFAQLSELHCDKLHVDPENFKLLGNVLVTVLAIH 60 70 80 90 100 110 120 130 140 pF1KE1 FPADFTAEAHAAWDKFLSVVSSVLTEKYR : .:: :..:.:.:....:.:.:. .: CCDS77 FGKEFTPEVQASWQKMVTAVASALSSRYH 120 130 140 >>CCDS7756.1 HBE1 gene_id:3046|Hs108|chr11 (147 aa) initn: 287 init1: 287 opt: 357 Z-score: 503.2 bits: 99.0 E(32554): 1e-21 Smith-Waterman score: 357; 40.0% identity (75.9% similar) in 145 aa overlap (3-141:4-146) 10 20 30 40 50 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHF-DLH-P----GS .: :.. ..:.:.:.... : :.: ::.. .: :. .: : .: : :. CCDS77 MVHFTAEEKAAVTSLWSKMNVE--EAGGEALGRLLVVYPWTQRFFDSFGNLSSPSAILGN 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 AQLRAHGSKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAAR ...:::.::... :::.:..:.. :..:::::: :.::: :::::.. ... ::.. CCDS77 PKVKAHGKKVLTSFGDAIKNMDNLKPAFAKLSELHCDKLHVDPENFKLLGNVMVIILATH 60 70 80 90 100 110 120 130 140 pF1KE1 FPADFTAEAHAAWDKFLSVVSSVLTEKYR : .:: :..:::.:..:.:. .:..:: CCDS77 FGKEFTPEVQAAWQKLVSAVAIALAHKYH 120 130 140 >>CCDS31376.1 HBD gene_id:3045|Hs108|chr11 (147 aa) initn: 239 init1: 239 opt: 330 Z-score: 465.8 bits: 92.1 E(32554): 1.3e-19 Smith-Waterman score: 330; 38.6% identity (73.1% similar) in 145 aa overlap (3-141:4-146) 10 20 30 40 50 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHF-DLH-P----GS :: :.: . ..:.:.. .:..: :.: ::.. .: :. .: : :: : :. CCDS31 MVHLTPEEKTAVNALWGKVN--VDAVGGEALGRLLVVYPWTQRFFESFGDLSSPDAVMGN 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 AQLRAHGSKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAAR ...:::.::..: .:.. .:.. :..:.::::: :.::: ::.::.. :. .:: CCDS31 PKVKAHGKKVLGAFSDGLAHLDNLKGTFSQLSELHCDKLHVDPENFRLLGNVLVCVLARN 60 70 80 90 100 110 120 130 140 pF1KE1 FPADFTAEAHAAWDKFLSVVSSVLTEKYR : .:: . .::..: .. :...:..:: CCDS31 FGKEFTPQMQAAYQKVVAGVANALAHKYH 120 130 140 >>CCDS7753.1 HBB gene_id:3043|Hs108|chr11 (147 aa) initn: 231 init1: 231 opt: 321 Z-score: 453.4 bits: 89.8 E(32554): 6.2e-19 Smith-Waterman score: 321; 37.2% identity (73.1% similar) in 145 aa overlap (3-141:4-146) 10 20 30 40 50 pF1KE1 MSLTKTERTIIVSMWAKISTQADTIGTETLERLFLSHPQTKTYFPHF-DLH-P----GS :: :.. ....:.:.. .: .: :.: ::.. .: :. .: : :: : :. CCDS77 MVHLTPEEKSAVTALWGKVN--VDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGN 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 AQLRAHGSKVVAAVGDAVKSIDDIGGALSKLSELHAYILRVDPVNFKLLSHCLLVTLAAR ...:::.::..: .:.. .:.. :... ::::: :.::: ::.::.. :. .:: . CCDS77 PKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHH 60 70 80 90 100 110 120 130 140 pF1KE1 FPADFTAEAHAAWDKFLSVVSSVLTEKYR : .:: ..::..: .. :...:..:: CCDS77 FGKEFTPPVQAAYQKVVAGVANALAHKYH 120 130 140 142 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 22:35:21 2016 done: Sun Nov 6 22:35:22 2016 Total Scan time: 1.720 Total Display time: -0.020 Function used was FASTA [36.3.4 Apr, 2011]