FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1945, 500 aa 1>>>pF1KE1945 500 - 500 aa - 500 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1886+/-0.000817; mu= 18.6656+/- 0.049 mean_var=66.9838+/-14.090, 0's: 0 Z-trim(106.8): 48 B-trim: 600 in 2/52 Lambda= 0.156707 statistics sampled from 9136 (9183) to 9136 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.282), width: 16 Scan time: 2.930 The best scores are: opt bits E(32554) CCDS13419.1 PTGIS gene_id:5740|Hs108|chr20 ( 500) 3345 765.3 0 CCDS2707.1 CYP8B1 gene_id:1582|Hs108|chr3 ( 501) 1303 303.7 3.2e-82 CCDS6171.1 CYP7A1 gene_id:1581|Hs108|chr8 ( 504) 923 217.8 2.3e-56 CCDS6180.1 CYP7B1 gene_id:9420|Hs108|chr8 ( 506) 829 196.5 5.8e-50 >>CCDS13419.1 PTGIS gene_id:5740|Hs108|chr20 (500 aa) initn: 3345 init1: 3345 opt: 3345 Z-score: 4084.7 bits: 765.3 E(32554): 0 Smith-Waterman score: 3345; 100.0% identity (100.0% similar) in 500 aa overlap (1-500:1-500) 10 20 30 40 50 60 pF1KE1 MAWAALLGLLAALLLLLLLSRRRTRRPGEPPLDLGSIPWLGYALDFGKDAASFLTRMKEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MAWAALLGLLAALLLLLLLSRRRTRRPGEPPLDLGSIPWLGYALDFGKDAASFLTRMKEK 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 HGDIFTILVGGRYVTVLLDPHSYDAVVWEPRTRLDFHAYAIFLMERIFDVQLPHYSPSDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HGDIFTILVGGRYVTVLLDPHSYDAVVWEPRTRLDFHAYAIFLMERIFDVQLPHYSPSDE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 KARMKLTLLHRELQALTEAMYTNLHAVLLGDATEAGSGWHEMGLLDFSYSFLLRAGYLTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KARMKLTLLHRELQALTEAMYTNLHAVLLGDATEAGSGWHEMGLLDFSYSFLLRAGYLTL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 YGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSLSVGDKDHMCSVKSRLWKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSLSVGDKDHMCSVKSRLWKL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 LSPARLARRAHRSKWLESYLLHLEEMGVSEEMQARALVLQLWATQGNMGPAAFWLLLFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LSPARLARRAHRSKWLESYLLHLEEMGVSEEMQARALVLQLWATQGNMGPAAFWLLLFLL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 KNPEALAAVRGELESILWQAEQPVSQTTTLPQKVLDSTPVLDSVLSESLRLTAAPFITRE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KNPEALAAVRGELESILWQAEQPVSQTTTLPQKVLDSTPVLDSVLSESLRLTAAPFITRE 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 VVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYTDPEVFKYNRFLNPDGSEKKDF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYTDPEVFKYNRFLNPDGSEKKDF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 YKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVLVHLDLELINADVEIPEFDLSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVLVHLDLELINADVEIPEFDLSR 430 440 450 460 470 480 490 500 pF1KE1 YGFGLMQPEHDVPVRYRIRP :::::::::::::::::::: CCDS13 YGFGLMQPEHDVPVRYRIRP 490 500 >>CCDS2707.1 CYP8B1 gene_id:1582|Hs108|chr3 (501 aa) initn: 1292 init1: 907 opt: 1303 Z-score: 1589.7 bits: 303.7 E(32554): 3.2e-82 Smith-Waterman score: 1303; 40.9% identity (69.4% similar) in 506 aa overlap (3-500:4-499) 10 20 30 40 50 pF1KE1 MAWAALLGLLAALL--LLLLLSRRRTRRPGEPPLDLGSIPWLGYALDFGKDAASFLTRM :. .:: : ... : : . : ::: ::::: :..::::.:. : :. :: :: CCDS27 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 KEKHGDIFTILVGGRYVTVLLDPHSYDAVVWEPRTRLDFHAYAIFLMERIF---DVQLPH . ::::.::. .::.: : ..:: :. ... . . .::: :: :. ..: .:: : CCDS27 RTKHGDVFTVQLGGQYFTFVMDPLSFGSILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 YSPSDEKARMKLTLLHRELQALTEAMYTNLHAVLL---GDATEAGSGWHEMGLLDFSYSF . ... : :. :.:.: .: :.: : . .: : ::: .:. : : . CCDS27 EMIHSASTKH---LRGDGLKDLNETMLDSLSFVMLTSKGWSLDA-SCWHEDSLFRFCYYI 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 LLRAGYLTLYGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSLSVGDKDHMC :. ::::.:.: ... :: ......: ::..: :.:... . : . .. CCDS27 LFTAGYLSLFGYT------KDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 SVKSRLWKLLSPARLARRAHRSKWLESYLLHLEEMGVSEEMQARALVLQLWATQGNMGPA .. . :.:: .. .. :.:: ..: :.:.:: :: . ..:::.::: ::. CCDS27 RLQRLFHKMLSVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPT 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 AFWLLLFLLKNPEALAAVRGELESILWQAEQPVSQTTTLPQKVLDSTPVLDSVLSESLRL .:: ::.:::.:::. ::: : ..: .:. ..:. .. .:. :::::::. :.::: CCDS27 SFWALLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 TAAPFITREVVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYTDPEVFKYNRFLN ::: . : : : .. :..:.:. .:.:: : :::.:: . ::.:. .: ::::.:::: CCDS27 RAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLN 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 PDGSEKKDFYKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVLVHLDLELINADV :.::.: ::.: ::....:.::::.: . : :: .:.. .: :..:...:.::::.. :. CCDS27 PNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDT 420 430 440 450 460 470 480 490 500 pF1KE1 EIPEFDLSRYGFGLMQPEHDVPVRYRIRP .:. : .:.::: ::: ::: :::..: CCDS27 PLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE 480 490 500 >>CCDS6171.1 CYP7A1 gene_id:1581|Hs108|chr8 (504 aa) initn: 675 init1: 349 opt: 923 Z-score: 1125.4 bits: 217.8 E(32554): 2.3e-56 Smith-Waterman score: 923; 33.0% identity (64.2% similar) in 509 aa overlap (1-499:6-502) 10 20 30 40 50 pF1KE1 MAWAALLGLLAALLLLLLLSRRRTRRPGEPPLDLGSIPWLGYALDFGKDAASFLT . :. .. : :.: . ::.: :::::. : ::.:: ::.:: . :: CCDS61 MMTTSLIWGIAIAACCCLWLILGIRRRQT---GEPPLENGLIPYLGCALQFGANPLEFLR 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 RMKEKHGDIFTILVGGRYVTVLLDPHSYDAVVWEPR----TRLDFHAYAIFLMERIFDVQ ..::: .:: . :.:: . .: :: :. . . .. : . : . .: .: . CCDS61 ANQRKHGHVFTCKLMGKYVHFITNPLSYHKVLCHGKYFDWKKFHFATSAKAFGHRSIDPM 60 70 80 90 100 110 120 130 140 150 160 pF1KE1 LPHYSPSDEKARMKLTLLHRELQALTEAMYTNLHAVLLGDATEAG--SGWHEMGLLDFSY . . . . . .: :: . :..:::.:. ::. .. .. . ..: :. .: : CCDS61 DGNTTENINDTFIK-TLQGHALNSLTESMMENLQRIMRPPVSSNSKTAAWVTEGMYSFCY 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 SFLLRAGYLTLYGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSLSVGDKDH ...:::::..: . : : ...: ..: . . .:.:.:...: :. : : . CCDS61 RVMFEAGYLTIFGRD-LTR-RDTQ---KAHILNNLDNFKQFDKVFPALVAG-LPIHMFRT 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 MCSVKSRLWKLLSPARLARRAHRSKWLESYLLHLEEMGVSEEMQ-ARALVLQLWATQGNM ... .: . : : .: :. . .. . ... .... :.. .. :::.:.: CCDS61 AHNAREKLAESLRHENLQKRESISELISLRMFLNDTLSTFDDLEKAKTHLVVLWASQANT 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 GPAAFWLLLFLLKNPEALAAVRGELESILWQAEQPVS---QTTTLPQKVLDSTPVLDSVL ::.:: :. ...::::. :. :.. : .: : :: . : : :.. :::::.. CCDS61 IPATFWSLFQMIRNPEAMKAATEEVKRTLENAGQKVSLEGNPICLSQAELNDLPVLDSII 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 SESLRLTAAPFITREVVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYTDPEVFK .:::::..: . : . :... . :: .:.:. : . :.: : . ::::: :: .:: CCDS61 KESLRLSSASLNIRTAKEDFTLHLEDGS-YNIRKDDIIALYPQLM-HLDPEIYPDPLTFK 360 370 380 390 400 410 420 430 440 450 460 pF1KE1 YNRFLNPDGSEKKDFYKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVLVHLDLE :.:.:. .:. : :: .: .:: : ::.:.: . : :: .:.. ::::..:.: ...:: CCDS61 YDRYLDENGKTKTTFYCNGLKLKYYYMPFGSGATICPGRLFAIHEIKQFLILMLSYFELE 410 420 430 440 450 460 470 480 490 500 pF1KE1 LINADVEIPEFDLSRYGFGLMQPEHDVPVRYRIRP ::..... : .: :: :.:.. : .:. .:... CCDS61 LIEGQAKCPPLDQSRAGLGILPPLNDIEFKYKFKHL 470 480 490 500 >>CCDS6180.1 CYP7B1 gene_id:9420|Hs108|chr8 (506 aa) initn: 695 init1: 277 opt: 829 Z-score: 1010.5 bits: 196.5 E(32554): 5.8e-50 Smith-Waterman score: 882; 34.1% identity (63.9% similar) in 499 aa overlap (7-499:22-505) 10 20 30 40 pF1KE1 MAWAALLGLLAALLLLLL-LSRRRTRRPGEPPLDLGSIPWLGYAL :.: :::::: : : ::::::::::: : .:.:: .: CCDS61 MAGEVSAATGRFSLERLGLPGLALAAALLLLALCLLVRRTRRPGEPPLIKGWLPYLGVVL 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 DFGKDAASFLTRMKEKHGDIFTILVGGRYVTVLLDPHSYDAVVWEPRTRLDFHAYAIFLM .. :: :. ....::: ::.:.::.:.: .::: .:. :. . . .:.:.... :. CCDS61 NLRKDPLRFMKTLQKQHGDTFTVLLGGKYITFILDPFQYQLVI-KNHKQLSFRVFSNKLL 70 80 90 100 110 110 120 130 140 150 160 pF1KE1 ERIFDV-QLPHYSPSDEKARMKLTLLH-RELQALTEAMYTNLHAVLLGDATEAGSGWHEM :. :.. :: . ... .. .:. . :. : :.:. ::. :. . .. : : CCDS61 EKAFSISQLQKNHDMNDELHLCYQFLQGKSLDILLESMMQNLKQVFEPQLLKTTS-WDTA 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 GLLDFSYSFLLRAGYLTLYGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSL : : :.... . :.:: . ... .. : : ..: . :. ... CCDS61 ELYPFCSSIIFEITFTTIYGKVIVCDNNKFISELR-------DDFLKFDDKFAYLV-SNI 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 SVGDKDHMCSVKSRLWKLLSPARLARRAHRSKWLESYLLHLEEMGVSEEMQARALVLQ-L . .. :.. .. : .: .::. :. ..: ::.. : :... : : : CCDS61 PIELLGNVKSIREKIIKCFSSEKLAKMQGWSEVFQSRQDVLEKYYVHEDLEIGAHHLGFL 240 250 260 270 280 290 290 300 310 320 330 pF1KE1 WATQGNMGPAAFWLLLFLLKNPEALAAVRGELESILWQAEQPVSQ--TTTLPQKVLDSTP ::. .: :. :: . .::..:::.:::: :.. .: .. : .. : .. ::: CCDS61 WASVANTIPTMFWAMYYLLRHPEAMAAVRDEIDRLLQSTGQKKGSGFPIHLTREQLDSLI 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE1 VLDSVLSESLRLTAAPFITREVVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYT :.: . :.:::.. : : ::.. : .. .:.:: . .:: . . ::::. CCDS61 CLESSIFEALRLSSYSTTIRFVEEDLTLSSETG-DYCVRKGDLVAIFPPVL-HGDPEIFE 360 370 380 390 400 400 410 420 430 440 450 pF1KE1 DPEVFKYNRFLNPDGSEKKDFYKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVL :: :.:.::.. ::..: :.: ::.:: : ::.:.: ..: :: .:. :::.. ..: CCDS61 APEEFRYDRFIE-DGKKKTTFFKRGKKLKCYLMPFGTGTSKCPGRFFALMEIKQLLVILL 410 420 430 440 450 460 460 470 480 490 500 pF1KE1 VHLDLELINADVEIPEFDLSRYGFGLMQPEHDVPVRYRIRP ...:::.:. : : .. :: ::.. :. :: ::... CCDS61 TYFDLEIID-DKPIG-LNYSRLLFGIQYPDSDVLFRYKVKS 470 480 490 500 500 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 15:50:04 2016 done: Mon Nov 7 15:50:05 2016 Total Scan time: 2.930 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]