FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6296, 792 aa 1>>>pF1KB6296 792 - 792 aa - 792 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4359+/-0.000888; mu= 14.9009+/- 0.054 mean_var=92.5861+/-17.974, 0's: 0 Z-trim(108.6): 63 B-trim: 5 in 2/51 Lambda= 0.133291 statistics sampled from 10237 (10293) to 10237 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.667), E-opt: 0.2 (0.316), width: 16 Scan time: 4.140 The best scores are: opt bits E(32554) CCDS9097.1 HCFC2 gene_id:29915|Hs108|chr12 ( 792) 5379 1045.0 0 CCDS44020.1 HCFC1 gene_id:3054|Hs108|chrX (2035) 2005 396.4 2.5e-109 >>CCDS9097.1 HCFC2 gene_id:29915|Hs108|chr12 (792 aa) initn: 5379 init1: 5379 opt: 5379 Z-score: 5589.1 bits: 1045.0 E(32554): 0 Smith-Waterman score: 5379; 100.0% identity (100.0% similar) in 792 aa overlap (1-792:1-792) 10 20 30 40 50 60 pF1KB6 MAAPSLLNWRRVSSFTGPVPRARHGHRAVAIRELMIIFGGGNEGIADELHVYNTATNQWF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 MAAPSLLNWRRVSSFTGPVPRARHGHRAVAIRELMIIFGGGNEGIADELHVYNTATNQWF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 LPAVRGDIPPGCAAHGFVCDGTRILVFGGMVEYGRYSNELYELQASRWLWKKVKPHPPPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 LPAVRGDIPPGCAAHGFVCDGTRILVFGGMVEYGRYSNELYELQASRWLWKKVKPHPPPS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GLPPCPRLGHSFSLYGNKCYLFGGLANESEDSNNNVPRYLNDFYELELQHGSGVVGWSIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 GLPPCPRLGHSFSLYGNKCYLFGGLANESEDSNNNVPRYLNDFYELELQHGSGVVGWSIP 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 VTKGVVPSPRESHTAVIYCKKDSGSPKMYVFGGMCGARLDDLWQLDLETMSWSKPETKGT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VTKGVVPSPRESHTAVIYCKKDSGSPKMYVFGGMCGARLDDLWQLDLETMSWSKPETKGT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 VPLPRSLHTASVIGNKMYIFGGWVPHKGENTETSPHDCEWRCTSSFSYLNLDTTEWTTLV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VPLPRSLHTASVIGNKMYIFGGWVPHKGENTETSPHDCEWRCTSSFSYLNLDTTEWTTLV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 SDSQEDKKNSRPRPRAGHCAVAIGTRLYFWSGRDGYKKALNSQVCCKDLWYLDTEKPPAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SDSQEDKKNSRPRPRAGHCAVAIGTRLYFWSGRDGYKKALNSQVCCKDLWYLDTEKPPAP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 SQVQLIKATTNSFHVKWDEVSTVEGYLLQLSTDLPYQAASSDSSAAPNMQGVRMDPHRQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SQVQLIKATTNSFHVKWDEVSTVEGYLLQLSTDLPYQAASSDSSAAPNMQGVRMDPHRQG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 SNNIVPNSINDTINSTKTEQPATKETSMKNKPDFKALTDSNAILYPSLASNASNHNSHVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 SNNIVPNSINDTINSTKTEQPATKETSMKNKPDFKALTDSNAILYPSLASNASNHNSHVV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 DMLRKNEGPHTSANVGVLSSCLDVRTVIPETSVSSTVSSTQTMVTQQTIKTESSSTNGAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 DMLRKNEGPHTSANVGVLSSCLDVRTVIPETSVSSTVSSTQTMVTQQTIKTESSSTNGAV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 VKDETSLTTFSTKSEVDETYALPATKISRVETHATATPFSKETPSNPVATVKAGERQWCD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VKDETSLTTFSTKSEVDETYALPATKISRVETHATATPFSKETPSNPVATVKAGERQWCD 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 VGIFKNNTALVSQFYLLPKGKQSISKVGNADVPDYSLLKKQDLVPGTGYRFRVAAINGCG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 VGIFKNNTALVSQFYLLPKGKQSISKVGNADVPDYSLLKKQDLVPGTGYRFRVAAINGCG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB6 IGPFSKISEFKTCIPGFPGAPSAVRISKNVEGIHLSWEPPTSPSGNILEYSAYLAIRTAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 IGPFSKISEFKTCIPGFPGAPSAVRISKNVEGIHLSWEPPTSPSGNILEYSAYLAIRTAQ 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB6 IQDNPSQLVFMRIYCGLKTSCIVTAGQLANAHIDYTSRPAIVFRISAKNEKGYGPATQVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS90 IQDNPSQLVFMRIYCGLKTSCIVTAGQLANAHIDYTSRPAIVFRISAKNEKGYGPATQVR 730 740 750 760 770 780 790 pF1KB6 WLQGNNKKAPLN :::::::::::: CCDS90 WLQGNNKKAPLN 790 >>CCDS44020.1 HCFC1 gene_id:3054|Hs108|chrX (2035 aa) initn: 2713 init1: 1559 opt: 2005 Z-score: 2076.3 bits: 396.4 E(32554): 2.5e-109 Smith-Waterman score: 2022; 45.1% identity (68.6% similar) in 749 aa overlap (9-705:19-743) 10 20 30 40 50 pF1KB6 MAAPSLLNWRRVSSFTGPVPRARHGHRAVAIRELMIIFGGGNEGIADELH :.:: ...::::: :::::::::.::...::::::::.:::: CCDS44 MASAVSPANLPAVLLQPRWKRVVGWSGPVPRPRHGHRAVAIKELIVVFGGGNEGIVDELH 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB6 VYNTATNQWFLPAVRGDIPPGCAAHGFVCDGTRILVFGGMVEYGRYSNELYELQASRWLW ::::::::::.:::::::::::::.::::::::.::::::::::.:::.::::::::: : CCDS44 VYNTATNQWFIPAVRGDIPPGCAAYGFVCDGTRLLVFGGMVEYGKYSNDLYELQASRWEW 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB6 KKVKPHPPPSGLPPCPRLGHSFSLYGNKCYLFGGLANESEDSNNNVPRYLNDFYELELQH :..: . : .: :::::::::::: ::::::::::::.::: .::.::::::.: :::. CCDS44 KRLKAKTPKNGPPPCPRLGHSFSLVGNKCYLFGGLANDSEDPKNNIPRYLNDLYILELRP 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB6 GSGVVGWSIPVTKGVVPSPRESHTAVIYCKKDSGSPKMYVFGGMCGARLDDLWQLDLETM :::::.:.::.: ::.: ::::::::.: .::. . :. ..::: : :: ::: ::..:. CCDS44 GSGVVAWDIPITYGVLPPPRESHTAVVYTEKDNKKSKLVIYGGMSGCRLGDLWTLDIDTL 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB6 SWSKPETKGTVPLPRSLHTASVIGNKMYIFGGWVPHKGENTETSPHDCEWRCTSSFSYLN .:.:: .:..:::::::.:..::::::.:::::: ...... :. ::.::.... :: CCDS44 TWNKPSLSGVAPLPRSLHSATTIGNKMYVFGGWVPLVMDDVKVATHEKEWKCTNTLACLN 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB6 LDTTEWTTLVSDSQEDKKNSRPRPRAGHCAVAIGTRLYFWSGRDGYKKALNSQVCCKDLW ::: : :.. :. :: . :: :::::::::.::::.:::::::.:: :.:::::::: CCDS44 LDTMAWETILMDTLED---NIPRARAGHCAVAINTRLYIWSGRDGYRKAWNNQVCCKDLW 310 320 330 340 350 360 370 380 390 400 pF1KB6 YLDTEKPPAPSQVQLIKATTNSFHVKWDEVSTVEGYLLQLST-DLPYQAASSDS------ ::.::::: :..:::..:.:::..:.: :.:...:::::. :.: ::.. : CCDS44 YLETEKPPPPARVQLVRANTNSLEVSWGAVATADSYLLQLQKYDIPATAATATSPTPNPV 360 370 380 390 400 410 410 420 430 440 450 pF1KB6 ---------SAAPNMQGVRMDPHRQGSNNIVPNSINDTINSTKTEQPATKETSMKNKPDF : :: . ..: : . ...:.. ..: . : : . : CCDS44 PSVPANPPKSPAPAAAAPAVQPLTQVGITLLPQAAPAPPTTTTIQVLPTVPGSSISVPTA 420 430 440 450 460 470 460 470 480 490 500 510 pF1KB6 KALTDSNAILYPSLASNASNHNSHVVDMLRKNEGPHTSANVGVLSSCLDVRTVIPETSVS :.: .... .. .. .: : . . .: : : : :: :.: :.. CCDS44 ARTQGVPAVL--KVTGPQATTGTPLVTM--RPASQAGKAPVTVTSLPAGVRMVVPTQSAQ 480 490 500 510 520 530 520 530 540 550 pF1KB6 STV--SSTQ---------TMVTQQTIKTESSST------NGAVVKDET---SLTTFSTKS .:: :: : . .. : : :. : . ..:: . . ::. . CCDS44 GTVIGSSPQMSGMAALAAAAAATQKIPPSSAPTVLSVPAGTTIVKTMAVTPGTTTLPATV 540 550 560 570 580 590 560 570 580 590 600 pF1KB6 EVDETYAL---PATKISRVETHATATPFSKETPSN--PVATV-KAGE---RQWCDV---- .: . .. :::.. .. . ..: :. : .. :. :: :.: : .: CCDS44 KVASSPVMVSNPATRMLKTAAAQVGTSVSSATNTSTRPIITVHKSGTVTVAQQAQVVTTV 600 610 620 630 640 650 610 620 630 640 650 pF1KB6 --GIFKNNTALVSQFYLLPKGKQSISKVGNADVPDYSLLKKQDLVPGTGYRFRVAAING- :. :. : ::.. .: :. ::..:.. .:... . . ...:..: CCDS44 VGGVTKTIT-LVKSPISVPGGSALISNLGKV----MSVVQTKPV--------QTSAVTGQ 660 670 680 690 700 660 670 680 690 700 710 pF1KB6 CGIGPFSKISEFKTCIPGFPGAPSAVRISKNVEGIHLSWEPPTSPSGNILEYSAYLAIRT . :: ..: . : .: : . ... ...: . :. :: CCDS44 ASTGPVTQIIQTKGPLP----AGTILKLVTSADGKPTTIITTTQASGAGTKPTILGISSV 710 720 730 740 750 720 730 740 750 760 770 pF1KB6 AQIQDNPSQLVFMRIYCGLKTSCIVTAGQLANAHIDYTSRPAIVFRISAKNEKGYGPATQ CCDS44 SPSTTKPGTTTIIKTIPMSAIITQAGATGVTSSPGIKSPITIITTKVMTSGTGAPAKIIT 760 770 780 790 800 810 >-- initn: 832 init1: 444 opt: 822 Z-score: 846.8 bits: 168.9 E(32554): 7.6e-41 Smith-Waterman score: 824; 43.8% identity (71.2% similar) in 306 aa overlap (489-787:1719-2005) 460 470 480 490 500 510 pF1KB6 DSNAILYPSLASNASNHNSHVVDMLRKNEGPHTSAN-VGVLSSCLDVRTVIPETSVSSTV : : : .. :.::. ...:: CCDS44 QELAALVQQQQLQEAQAQQQHHHLPTEALAPADSLNDPAIESNCLN--------ELAGTV 1690 1700 1710 1720 1730 1740 520 530 540 550 560 570 pF1KB6 SSTQTMVTQQTIKTESSSTNGAVVKDETSLTTFSTKSEVDETYALPATKISRVETHATAT :: ... . ::: . ... : . ... .: .. :. ...: . . CCDS44 PSTVALL--PSTATESLAPSNTFVAPQPVVVASPAKLQA-------AATLTEVANGIESL 1750 1760 1770 1780 1790 580 590 600 610 620 630 pF1KB6 PFSKETPSNPVATVKAGERQWCDVGIFKNNTALVSQFYLLPKGK-QSISKVGNADVPDYS . . : : . : :: :::..:.....:....: : : . .:. ::::. CCDS44 GVKPDLPPPPSKAPMKKENQWFDVGVIKGTNVMVTHYFLPPDDAVPSDDDLGT--VPDYN 1800 1810 1820 1830 1840 640 650 660 670 680 690 pF1KB6 LLKKQDLVPGTGYRFRVAAINGCGIGPFSKISEFKTCIPGFPGAPSAVRISKNVEGIHLS ::::.: :::.:.::::.::.:: ::::.:: ::::.::::::: :..:::. .: ::. CCDS44 QLKKQELQPGTAYKFRVAGINACGRGPFSEISAFKTCLPGFPGAPCAIKISKSPDGAHLT 1850 1860 1870 1880 1890 1900 700 710 720 730 740 750 pF1KB6 WEPPTSPSGNILEYSAYLAIRTAQI-----QDNPSQLVFMRIYCGLKTSCIVTAGQLANA ::::. ::.:.:::.::::...: ...:.::.:::.::: . ::.: ...:.:: CCDS44 WEPPSVTSGKIIEYSVYLAIQSSQAGGELKSSTPAQLAFMRVYCGPSPSCLVQSSSLSNA 1910 1920 1930 1940 1950 1960 760 770 780 790 pF1KB6 HIDYTSRPAIVFRISAKNEKGYGPATQVRWLQGNNKKAPLN :::::..:::.:::.:.::::::::::::::: ..: CCDS44 HIDYTTKPAIIFRIAARNEKGYGPATQVRWLQETSKDSSGTKPANKRPMSSPEMKSAPKK 1970 1980 1990 2000 2010 2020 CCDS44 SKADGQ 2030 792 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:40:34 2016 done: Mon Nov 7 18:40:34 2016 Total Scan time: 4.140 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]